论文部分内容阅读
随着全国各大高校毕业生人数的逐年增加,庞大的就业群给社会带来了不小的就业压力。同时伴随着大数据时代的来临,校园数字化的全面建设,校园内已经积累了海量的学生行为数据。自我感知理论认为,人的行为可以用来作为推断个人目标的线索。本文基于学生在校时的一卡通消费,图书借阅,图书馆门禁,课程成绩等数据,分析学生的在校行为,并运用数据挖掘算法建立模型,用于预测学生未来的毕业去向选择。从而来引导学生进行个性化的职业生涯规划,为缓解高校毕业生就业难的问题,提供了新的解决思路。根据往届本科毕业生的毕业去向可以将学生分为四类:就业,录研,出国深造,其它。在本文的研究过程中,主要从以下三个方面来量化分析学生的在校行为:(1)根据学生在校内的各个地点的一卡通刷卡记录,设计算法,构造出衡量学生行为规律性的行为熵指标,用于量化学生在校的行为规律性;并对比分析不同类毕业去向的学生群体的差异性和渐变性。(2)根据学生的历史课程成绩数据,利用矩阵分解技术,构造损失函数,求解出表征学生专业能力的特征向量。(3)利用学生在图书馆的历史借阅记录,设计算法来构造出刻画学生个人兴趣的特征向量;同时利用学生在校内一卡通消费记录,分析不同类毕业去向的学生群体在校内消费的差异性,设计算法构造出表征学生家庭经济条件的特征向量。利用上述方法构造出的特征作为输入,建立预测模型,用于预测学生未来的毕业去向。研究结果表明,不同类毕业去向的学生群体在校内的行为,存在着较大的差异性;根据学生在校时的行为数据,可以较好的预测出学生未来的毕业去向;而且随着学生在校时间的累积,模型预测的精度在逐渐提高;在学生行为规律性、学生专业能力、学生个人兴趣、学生家庭经济条件这四类特征因素中,学生的专业能力对学生未来毕业去向的影响最大。最后,本文将理论运用于实际应用,构建了一个大学生毕业去向预测系统。该系统的实现基于Spring MVC架构,底层数据存放在MySQL数据库中,常用的数据分析结果依赖于Redis内存数据库。算法的实现集成了经典的机器学习算法包Weka。该系统将学生在校时的行为数据和分析结果,以可视化地方式展现出来,并能够根据学生在校时的行为数据来预测学生未来的毕业去向。