

本站小编 Free考研考试/2022-01-01

孙鑫1, 黎坚1,2(), 符植煜1
1 北京师范大学心理学部
2 应用实验心理北京市重点实验室, 北京 100875

基金资助:* 北京市教育科学“十二五”规划青年专项课题资助(CBA15048)

Using game log-file to predict students' reasoning ability and mathematical achievement: An application of machine learning

SUN Xin1, LI Jian1,2(), FU Zhiyu1
1 Faculty of Psychology, Beijing Normal University
2 Beijing Key Lab of Applied Experimental Psychology, Beijing 100875, China


摘要: 以360名初中生为被试, 使用推箱子游戏, 结合游戏日志文件(log-file)和机器学习技术预测学生的推理能力和数学成绩。预测变量是从推箱子的过程数据中提取的一系列特征指标, 结果变量是瑞文推理测验成绩和数学成绩, 且均以25%为高低分组的临界值转换为二分变量。结果发现, 训练的模型预测推理能力最高能获得76.11%的查准率、65.72%的精确率、63.10%的查全率以及65.01%的F1得分; 预测数学成绩最高能获得83.07%的查准率、73.70%的精确率、73.33%的查全率以及75.57%的F1得分。研究结果说明, 机器学习建立的区分模型具有较好的预测效果, 利用log-file所记录的游戏过程数据可以对个体的能力进行有效预测。



特征 平均值 标准差 最小值 最大值
第一步用时/平均执行时间 22.71 24.26 2.52 198.34
ln (第一步用时/平均执行时间) 2.31 0.82 0.81 4.97
完成箱子的比例 0.33 0.08 0.00 0.57
第一步用时/总时间 0.22 0.12 0.04 0.76
ln (第一步用时/总时间) -1.92 0.60 -3.31 -0.29
思考步数占比 -2.39 0.23 -3.04 -1.69
平均执行时间 0.64 0.15 0.37 1.33
执行间波动 2.15 1.20 0.35 10.52
重复步数占比 0.07 0.03 0.00 0.20
与最优步数相差 -5.75 9.45 -23.36 65.78
与最优路径重合步数占比 0.17 0.04 0.04 0.32
第一步用时/平均执行时间 24.36 23.81 2.65 168.97
ln (第一步用时/平均执行时间) 2.49 0.78 0.92 4.95
第一步用时/总时间 0.25 0.14 0.04 0.77
ln (第一步用时/总时间) -1.77 0.61 -3.18 -0.27
思考步数占比 -2.61 0.27 -3.53 -1.64
平均执行时间 0.48 0.11 0.33 1.18
执行间波动 1.17 0.76 0.20 5.43
重复步数占比 0.03 0.02 0.00 0.16
与最优步数相差 7.65 5.45 0.00 52.67
与最优路径重合步数占比 0.71 0.14 0.17 1.06

表现类型 预测为阳性 预测为阴性
实际为阳性 TP FN
实际为阴性 FP TN

最优化目标 F1 查准率 查全率 精确率
F1优先 68.83% 74.40% 61.19% 63.46%
查准率优先 63.72% 75.51% 59.17% 65.03%
查全率优先 65.01% 74.91% 63.10% 64.21%
精确率优先 64.22% 76.11% 59.05% 65.72%
F1优先 71.14% 79.35% 71.11% 68.02%
查准率优先 75.57% 83.07% 73.33% 73.70%
查全率优先 73.09% 81.06% 71.78% 70.62%
精确率优先 71.65% 80.19% 69.67% 69.44%

