距离优化的DBSCAN网络行为分析及N-Adaboost学业成绩预测研究

来源 :兰州大学 | 被引量 : 2次 | 上传用户:zhuce121566
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
越来越多的教育数据随着高校应用系统和硬件设备的汇总不断地产生,如何从这些大数据中挖掘出给各层决策者更加科学、准确的决策信息,给高校信息化建设者带来了重大挑战。学业水平分析是教育数据挖掘中不可忽视的一环,为学校全面客观地评价学生提供了依据。高校管理者可以据此掌握学生行为特点和模式,促进个性化教育,及时发现并干预学生异常行为,提高教学管理质量及学生服务水平。目前,国内外关于高校学业水平分析的研究都是基于简单数据、简单模型的浅层次分析,面向领域单一,有的是面向校园一卡通消费数据,有的是面向在线教育平台数据,尚未有对于网络行为和其他数据结合起来进行学业水平的影响研究。本文针对现有研究领域的缺陷和不足,将关注点集中于网络行为,以国内某高校本科学生为例,对学生网络行为数据、一卡通数据及学业成绩数据进行分析。实证分析表明,网络行为数据和一卡通数据的结合能够更加有效地反映学业水平,并产生更为准确的预测。本文具体工作如下:(1)构建学生行为“画像”特征库,提出了“三个方面”网络行为、网络粘度、生活规律性来有效地刻画学生行为;针对传统DBSCAN算法,提出了基于距离优化的DBSCAN算法,该算法对邻域半径δ进行了优化,通过计算minPts个样本点间平均距离选择初始邻域半径δ,并在聚类过程中使用核心点与其δ邻域内样本点之间的距离系数动态地调整邻域半径,以加快聚类收敛速度;使用该算法分别从“三个方面”对学生行为描述指标进行聚类分析,得到了具有不同行为特征的学生群体;相比于传统DBSCAN算法,距离优化的DBSCAN算法在学生行为方面聚类效果和准确性提升了9.2%,综合性能表现优于传统DBSCAN算法。(2)学业水平影响因素的可视化分析。详细描述了学业水平的影响因素在不同学生群体之间的表现规律及差异性并采用ANOVA F-test检验筛选出对学业水平表现有显著影响的特征。(3)提出了基于多分类器的异态N-Adaboost算法,该算法基分类器Γ()由N个分类器H4)(x)构成,并由H4)(x)投票产生结果,通过对Γ()迭代更新样本权值从而得到最终的预测结果。通过对不同组别学生的学业成绩预测证明,基于多分类器的N-Adaboost模型在学业水平预测方面准确度获得了显著提高,达到了73.29%(“及格与不及格”组)、73.74%(“优异与非优异”组)和81.36%(“优异与不及格”组),均高于其他分类器。并且分析了不同N对于预测性能及准确性的影响,实验得出N>3时,模型在时间上的消耗程度远大于预测精度的提升。该模型在传统Adaboost模型的基础上改进了构成基分类器的种类,将各分类模型优势互补,提高了算法“短板”,性能和预测准确性方面获得了有效提升。(4)设计并实现了学业预警系统,基于N-Adaboost预测模型使用Django MVC框架,设计了具有三层架构的预警系统:数据接入层、数据处理层、数据显示层。详细介绍了该系统包含的四个功能模块:基本信息模块、网络行为模块、可视化模块和预警模块,并以某学院预警页面为例,对系统的功能页面及工作流程进行了说明。该系统为学校管理者提供了学生个人信息、网络行为及学业成绩预警等多方面功能,并在学工部门得到了实际应用,具有较好的实际意义。
其他文献
2018年3月13日,第十三届全国人民代表大会通过了关于国务院体制改革方案的决定,正式拉开了我国改革开放以来最新一轮政府机构改革的序幕。根据中共十九大和中共十九届三中全
动物隐喻的研究在学术界引起了广泛的关注。不少学者对其进行过深入探究,迄今为止动物隐喻的理解机制研究包括语义学,社会语言学,认知语言学以及跨文化对比分析等领域。其中
在国家新能源政策推动下、国内大中城市空气质量连年下降,对碳排放越来越严格情况下,推动新能源汽车产业迅速崛起,为各汽车企业创造了难得的发展机遇,为了取得新一轮汽车革命
独立董事的概念最早起源于美国,20世纪30年代美国颁布《投资公司法》标志着独立董事的产生。独立董事制度在我国发展的十多年里,关于独立董事的履职效果以及有效性的争议越来越多,独立董事的职能是否如花瓶一般形同虚设,公司设立独立董事席位是否能改善治理效果从而带来业绩增长。诸多问题一直以来都是学术界和业界所讨论的热点。从本质上来看,独立董事与持股股东之间也是委托人与代理人之间的委托代理关系,而处理委托代理
抗日战争时期的西迁高校建筑遗址是人类物质文化遗产的重要组成部分。它见证了历史的变迁,见证了教育的发展,是传承人文价值的重要载体。由于各种原因,这些抗日战争时期西迁留下的高校建筑遗址没有得到应有的重视,抗战时期后方学校的建筑遗址的保护情况也非常不乐观,在今天这个文化高度发达的年代,这些西迁高校的这种现状是与国家的发起加强文化遗产的保护行为的号召相违,也不能满足背当下的文化需求。四川江津地区有大量抗战
目的:探讨"四化"管理模式在优质护理服务示范病房创建中的应用效果。方法:选择2009年10月~2010年3月的517例乳腺疾病患者作为对照组,采用常规护理模式;选择2010年4~9月的539例
近年来,幼儿园“小学化”倾向的问题成为我国学前教育领域关注研究的一个热点,也是制约我国建设高质量的学前教育的影响因素。政府及相关教育部门对此十分重视,连续下发系列
以中国东南部沿海台风多发区3类典型大跨度桥梁为例,即长江三角洲区域舟山群岛西堠门大桥,上海长江大桥和珠江三角洲区域广州新光大桥,运用Monte—Carlo随机模拟算法,结合大量台
明代中后期,花生由美洲传入中国,逐渐成为重要的经济作物和油料作物。士人是传统农业生产力量的组成部分,往往选择将其劳动实践载诸笔端,这就为探讨花生的栽培技术提供了一些
元认知监测是元认知研究的重要组成部分,近年来成为国内外众多研究者关注的热点。已有大量研究发现元认知监测的准确性对自我调节学习具有重要意义。学习判断(Judgment of Le