立项背景是课程挂科率达18%,需提前识别风险学生提供辅导,目标是预测学生课程成绩并定位薄弱环节。核心功能包括成绩影响因素分析、回归模型训练、风险学生预警;业务流程为采集学生“考勤/作业完成度/前置课程成绩”等数据,建模后输出成绩预测值,对预测低于60分的学生推送辅导建议。
采用“统计分析+梯度提升回归”方案:用StatsModels做相关性分析,发现“作业完成率(r=0.72)”“前置课程成绩(r=0.68)”是核心影响因素;用LightGBM构建回归模型(R²=0.83),实现成绩预测;生成“风险学生-薄弱环节”对应表。我负责相关性分析与模型落地,最终课程挂科率降至10%,辅导资源利用率提升40%。难点是数据缺失(部分学生考勤记录不全),通过多重插补法填补数据解决。