信息教学创新23年4期

基于教育数据挖掘的学生画像构建与学情预测 分析研究
唐茜
(北京理工大学珠海学院,广东 珠海 519088)

摘  要:该研究通过采集学生在校的图书借阅、参加公益活动、上网等行为数据,采用随机森林算法挖掘行为特征与学业成绩之间的关联程度,提取关键特征进行加权计算合并形成新特征,通过基础模型 K-means 算法进行聚类分析,最终将学生划分成自律学霸型、夜猫子上网型和缺乏规划型三类学生。基于 Logistics 回归模型建立预测模型,分别讨论三类群学生的学习成绩预测效果,为教育工作者深入诊断学生的学习状态并给予精准的教学引导和干预提供参考。


关键词:教育数据挖掘;行为数据;学生画像;关联度;预测分析



DOI:10.19850/j.cnki.2096-4706.2023.04.048


基金项目:广东省教育评估协会 2021 年度研究课题(21GJYPG10);北京理工大学珠海学院校级教学改革项目(2020009JXGG)


中图分类号:TP311                                         文献标识码:A                                       文章编号:2096-4706(2023)04-0193-06


Research on Student Portrait Construction and Learning Condition Prediction Based on Educational Data Mining

TANG Qian

(Beijing Institute of Technology, Zhuhai, Zhuhai 519088, China)

Abstract: By collecting the behavioral data of students' book borrowing, participating in public welfare activities and surfing the Internet, this paper uses the random forest algorithm to mine the correlation degree between behavior characteristics and academic performance, and the key characteristics are extracted to weight and calculate for merger to form new characteristics. Through the clustering analysis of the basic model K-means algorithm, the students are divided into three types of excellent performance in self-discipline, late sleepers with Internet access and lack of planning. This paper establishes a prediction model based on the logistic regression model, and discusses the prediction effect of the three types of students, which provides a reference for educators to deeply diagnose students' learning status and give precise teaching guidance and intervention.

Keywords: educational data mining; behavioral data; student portrait; correlation; prediction analysis


参考文献:

[1] 王宏志,熊风,邹开发,等 . 教育大数据分析:方法与探索 [J]. 中国大学教学,2017(5):53-57.

[2] 杜婧敏,方海光,李维杨,等 . 教育大数据研究综述 [J].中国教育信息化,2016(19):1-4.

[3] 李凤霞,徐玉晓 . 国际教育大数据研究综述 [J]. 软件导刊:教育技术,2019,18(12):83-85.

[4] KLAŠNJA-MILIĆEVIĆ A,IVANOVIĆ M,BUDIMAC Z. Data science in education:Big data and learning analytics [J].Computer applications in engineering education,2017,25(6):1066-1078.

[5] DARRELL M W. Big Data for education:data mining,data analytics,and web dashboards. Governance studies at brookings [R]. Washington:Brookings Institution,2012:1-10.

[6] 卓文秀,杨成,李海琦 . 大数据与教育智能——第 17 届教育技术国际论坛综述 [J]. 终身教育研究,2019,30(3):62-67.

[7] 杨长春,徐筱,宦娟,等 . 基于随机森林的学生画像特征选择方法 [J]. 计算机工程与设计,2019,40(10):2827-2834.

[8] 郭顺利,张宇 . 基于 VALS2 的在线健康社区大学生用户群体画像构建研究 [J]. 现代情报,2021,41(10):47-58.

[9] KIU C. Data Mining Analysis On Student’s Academic Performance Through Exploration Of Student’s Background And Social Activities [C]//2018 Fourth International Conference on Advances in Computing,Communication & Automation (ICACCA).Subang Jaya:IEEE,2018:1-5.

[10] 张治,刘小龙,徐冰冰,等 . 基于数字画像的综合素质评价:框架、指标、模型与应用 [J]. 中国电化教育,2021(8):25-33+41.

[11] 薛耀锋,曾志通,王亚飞,等 . 面向区域教育治理的学校画像研究 [J]. 中国教育信息化,2020(7):67-70.

[12] 叶俊民,罗达雄,陈曙 . 基于短文本情感增强的在线学习者成绩预测方法 [J]. 自动化学报,2020,46(9):1927-1940.

[13] 蒋卓轩,张岩,李晓明 . 基于 MOOC 数据的学习行为分析与预测 [J]. 计算机研究与发展,2015,52(3):614-628.


作者简介:唐茜(1988—),女,汉族,湖北松滋人,讲师,硕士,研究方向:数据挖掘与分析、供应链信息共享。