基于机器学习的高等教育成绩排名预测和影响因素分析

来源 :刘灿晖 | 被引量 : 0次 | 上传用户:saosaoxp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据的出现,机器学习作为重要预测手段在金融学以及管理学当中的应用越来越普及,然而在经济学特别是教育经济学领域的应用还相对较少。如今,高等教育也越来越受到人们的关注,在互联网技术的帮助下,教育者可以使用机器设备自动收集学生的数据,也可以使用数学模型分析现有的积累的数据,以此来帮助学生更有效率地学习、帮助学校拥有更好的评价。本文研究将机器学习应用于教育领域,使用机器学习预测北京15所高等院校的成绩排名、分析高等教育成绩排名的影响因素并对成绩排名较差的学生进行异质性,得到了以下成果:(1)机器学习模型相比OLS模型,更擅长进行高维度的数据的预测,并且在高等教育成绩排名预测中,数据量带来预测效果的提升要比数据质量带来的大。另外,机器学习模型除了在准确率、召回率和F1-Score这些指标上优于OLS模型,还能够通过调整参数在实际中达到成本限制下的最优预测效果。(2)部分机器学习擅长从大量特征中找到对模型预测效果影响较大的影响因素,从随机森林模型和LightGBM模型计算的特征重要性排名来看,学生大一时期每个类别都有对最终排名影响较大的特征,并且部分这些特征还没有被学者研究过,因此,这些重要特征不仅给高等教育研究的相关人员提供了更多维度的学生评价指标参考,也提供了更多高等教育成绩影响因素研究的参考方向。(3)机器学习中的无监督学习方法可以对成绩排名较差的学生进行异质性分析,本文在说明大二干预的有效性之后,使用K-means模型将高等教育成绩排名后10%的学生聚为3类,并根据每个类别的特点提出不同且可靠的干预方案建议。综上所述,机器学习能够更灵活、准确、可靠地预测高等教育成绩排名,通过排名来反向挖掘特征重要性较高的影响因素,并能够识别学生内部的异质性来给干预提供合理的建议,是一种低成本且高效的高等教育成绩排名预测和政策建议方案。
其他文献
文本中的拼写错误和语法错误在日常生活中十分常见,这些错误通常是由语言使用者的书写、自动语音识别、光学字符识别等原因引起的。文本纠错技术可以自动识别出文本中的拼写错误和语法错误,具有重要的研究意义。中文文本纠错技术对于快速校验海量电子文本、帮助中文初学者学习中文、保证下游任务的输入准确性等方面都有着重要的保障作用,并且在搜索引擎、文章自动评分、光学字符识别等许多与人们生活息息相关的应用中都发挥着重要
学位
近年来,制造业等领域在设计、生产、销售和服务环节中产生了文本、图像、音视频等海量多模态数据,如何高效地管理与利用这些数据资源为制造业等领域再生产创造价值是当前企业面临的重大难题。传统的数据存储与检索系统将多模态数据按照不同的形式或者模态进行分类并单独处理,导致了跨模态数据之间缺乏关联(文本、图像、音视频数据之间无法高效互检),无法支持企业业务流程的问题。因此,为了高效利用企业的多模态数据资源,提高
学位
在磁场影响下,地磁场中的铁磁性物质会引起其周围地磁场的微弱异常变化。航空磁异常探测技术通过捕获这种磁异常变化实现对磁性物体位置信息的反演,在侦察打击、目标追踪方面发挥着重要作用。其中,利用航空磁探平台实现对动态磁异常目标的追踪成为研究热点和研究难点。目前,实际采用的追踪策略主要包括螺旋、苜蓿叶、测线等经典轨迹,由指挥人员依据自身经验进行决策。该策略对指挥人员的依赖程度高,受主观影响大,同时追踪决策
学位
通过对川中丘陵区引种的三个美国紫薇品种(Red Rocket、E. Ember、Delta Blush)进行花期观测与及其花粉萌发能力比较。结果表明:3种紫薇均在7月底或8月上旬进入开花期,花期可遇,花期少于原引种地——湖南;3个品种的长/短花丝花药中的花粉粒均能正常萌发,长花丝花药中的花粉粒萌发率更高,因此,两类花药均可为杂交供花粉;3个品种均可自交和异交,自交时,花粉管和精细胞12 h可进入子
期刊
随着工业互联网的发展,工业控制系统的信息化程度提高,工业控制系统的网络安全风险也随之提升,出现了各类针对工控信息系统的新型攻击技术和手段,是影响国家安全、经济发展和社会稳定的重大隐患。提升对工控系统漏洞的认识,是加强工控系统安全防护的重要途径。目前学术界对漏洞的分析一般是从漏洞的知识性信息入手,分析漏洞的严重性或可利用性,分析结果体现的是漏洞抽象属性,不能准确描述具体漏洞。本文借助知识图谱及其推理
学位
藻红蛋白(R-phycoerythrin,R-PE)是红藻中一种作为光合辅助色素的蛋白质。这种蛋白质在食品科学、免疫诊断、治疗、化妆品、蛋白质和细胞标记以及分析过程中的许多生物技术应用中具有重要意义。如今,实现藻红蛋白简单、高效的提取已成为研究热点。三相萃取法(Three-phase partitioning,TPP)作为一种简单高效的非色谱方法在高通量、易于规模化和成本效益等方面具有显著的优势,
学位
随着航天工作的任务越来越复杂,技术要求也逐渐提升。为了提高航天器的实时性与稳定性,减少软件系统延时对航天器的影响,实时操作系统被广泛地研究与应用。SPARC架构作为国际上航天设备通用的处理器体系架构,能够精简、高效地处理程序指令,避免了嵌入式系统指令冗余带来的执行效率低下的问题。其中,多核SPARC架构因为其易于扩充、性能高效、低功耗等特点受到广泛关注。因此对多核SPARC下的实时调度方法进行研究
学位
随着工业智能化时代的到来以及攻击技术的快速发展,工业控制系统正面临着严重的安全问题。工业控制系统暴漏的漏洞数量逐年上升,同时针对工业控制系统的攻击事件层出不穷,因此针对工业控制系统的安全研究迫在眉睫。针对工业控制系统的安全评估能够帮助用户了解系统的安全性,掌握系统的脆弱点以及威胁性。本文针对工业控制系统安全的分层评估技术进行研究,并完成了分层评估系统的设计。基于攻击图对系统威胁性建模,动态评估系统
学位
溶剂型环氧涂料因施工后会排放大量挥发性有机物(VOCs)污染环境,开发低VOCs的环保型水性环氧涂料成为当前涂料研究的重点。固化剂是决定水性环氧涂料性能的主要组份之一,但传统的胺类固化剂存在适用期短、与环氧树脂互容性差、固化成膜的涂层脆性大、耐蚀性差等问题,因此开发水性环氧固化剂对水性环氧涂料的应用具有重要意义。基于此,本文首先对传统胺类固化剂改性制备出力学性能优异的水性环氧固化剂,并以此固化剂为
学位
本研究以Kluckhohn&Stodtbeck文化价值取向理论为框架,以Braun&Clarke六阶段主题分析为研究方法,研究回答如下三个问题:1)澳大利亚Quora和中国知乎网民给出的2019-20年澳大利亚森林大火肆虐的原因是什么;2)在所选取的澳大利亚Quora和中国知乎网友社交媒体话语中,可以发现哪些文化价值取向;3)澳大利亚Quora和中国知乎网民对2019-20年澳大利亚森林大火成因的
学位