论文部分内容阅读
近几年来,随着教育数据挖掘领域的快速兴起,结合数据挖掘方法对学生行为数据进行分析成为一种流行趋势,主要致力于对未来行为与兴趣的发现、对学生学习表现的预测、以及学生个人或者群体特征的提取。学生行为模式的相关研究被广泛地关注,教育学、社会学等多个领域的研究发现学生的行为模式对于其学习表现、情感状态以及心理健康等各方面均有着客观的反映,如何对学生行为建模并对行为特征进行准确、全面的描述,均是需要考虑的重要问题。随着一卡通系统的完善与云存储技术的升级,大量的行为记录被采集,这也为刻画学生的个体行为模式提供了有力的数据支持。本文工作主要对学生行为模式上的数据挖掘方法进行探索,并将对行为模式的理解应用于学习表现的相关预测问题中。具体的研究内容总结如下。 (1)学生行为识别与行为建模。规范化从校园记录中识别学生行为序列的解决算法与提取学生行为模式的一系列过程。马尔科夫模型是目前应用于行为建模最广泛的模型之一,本文研究假设学生的日常行为符合马尔科夫性,并构造隐马模型捕获学生行为的规律性。对学生行为模式的构建是行为特征描述的基础,也是建立学生画像系统的重要前提。 (2)基于校园行为模式的学习表现预测。学习表现是衡量一个学校教学水平最关键的指标,也是当前教育数据挖掘领域的主要研究点之一。行为模式在一定程度上间接的反应着学生的心理状态、健康状态以及努力程度。本文提出一种基于行为模式的学生学习表现预测框架,从多个角度提取特征以更全面的描述行为,包括统计特征与关联特征,并且设计使用多任务模型,对学生在课程上的学习表现进行细粒度的预测。实验发现,所提框架对学习表现的预测有着较高的召回率,对提前预警工作也表现出一定的实用性。进一步地,根据模型对学生行为模式与学习表现间的相关性进行了探讨。 (3)基于在线学习行为的掌握度预测。在线学习方式在使用户的学习摆脱时间、空间限制的同时,也容易使其模糊判断自己的掌握情况,盲目于所要学习的内容,造成学习效果降低。本文提出一个基于在线学习行为的掌握度预测框架,于协同过滤算法中加入了附加上下文信息,包括学生-知识点掌握度与课节-知识点信息,并且根据所挖掘出的学习路径,对学生的掌握度进行预测。考虑到掌握度的时变性,根据艾宾浩斯遗忘曲线,对学生在知识点上的掌握程度进行近似曲线拟合。实验发现,附加信息的加入对预测效果尤其运行效率均有所提升。同时,所提框架不仅可以动态的评估学生对知识的掌握情况,其预测结果同时也便于系统进行复习反馈或调整学习顺序,提供个性化的学习服务。