论文部分内容阅读
随着当今网络技术的不断发展和互联网应用的普及,信息技术无时无刻不在改变我们传统的教学模式。2012年起开放在线课程MOOC在美国迅速兴起规模不断扩大,这个课程的出现,让全球教育界掀起了一场技术革命,这种教学的方式受到了学生、教师以及社会大众的广泛认同。本文研究的对象是,在我校开放的网络教育平台中,学习者在学习过程中产生的行为数据,比如学习视频的观看时间、学习效果、参与学习的活跃度(互动次数、讨论次数等)、作业的完成情况、实践活动次数等。不同学习者在进行学习的时候会产生不同的学习行为,本文的研究从分析这些学习行为的角度出发,完成了下列工作:(1)本论文侧重于使用大数据多种研究工具和方法来对本校MOOC平台下产生的所有课程参与者的日志数据进行清洗、处理、规范化和统计分析,从而分析出该课程学习者的学习行为特征。论文研究内容主要包含:对行为日志数据进行清洗及预处理,接着从课程基本统计描述信息、学习者个人基本信息特征、学习者观看视频相关行为、学习者做练习相关行为、学习者讨论区交互相关行为等方面进行特征分析,然后利用相关性分析和假设检验方法提取出对学习者成绩影响较大的因素和相关行为特征,同时结合机器学习分类预测算法建立学习者的成绩预测模型,最后用提取出的样本数据对模型进行训练和对学习者最后获取课程证书情况进行预测,比较不同算法的准确度并得出研究结论。(2)支持向量机(SVM)算法在我校开放在线课程学习平台学生行为分析中得出的结果有些许偏差,所以本文中提出了一种,在随机深林模型基础上建立的基尼(Gini)指标特征加权支持向量机方法(RFG-SVM),并且把这种方法应用在了在线开放课程平台学生行为分析中。RFG-SVM方法利用随机森林模型下的Gini指数,对各个特征变量进行了计算,通过计算获得了相关变量对RF模型分类识别准确性产生的影响度,然后对比数据集各属性的重要程度,按照获得的对比结果来对相应的特征设定权重值,通过设置让影响程度较大的特征属性得到更大的权重比。最后再将这些权重值应用于支持向量机的核函数,完成计算,通过这种方法希望让在线开放平台的学生行为分析方面具有更高的正确率,从而发现一些具有普遍意义的学习行为特征及习惯和规律,来预测学生们的最终学习成果。