基于LGB-LR模型的高校学生奖助学金预测方法研究

来源 :江西农业大学 | 被引量 : 0次 | 上传用户:yjcog
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络信息技术的遍及和智慧校园建设的推进,高校陆续推出各式各样的信息化平台,其中校园一卡通作为学校师生校园生活不可缺少的工具,其每天大量生成的使用记录对高校学生管理路径具有不可忽视的研究意义。学生奖、助学金评定作为高校学生管理工作中的重要环节,也是帮助高校完成贫困识别和学业预警的重要依据,但现在很多高校仅仅将其当作一项常规工作,未能从服务学生管理的角度出发,忽视了丰富的校园资源中隐藏的价值。基于校园大数据的高校学生管理工作路径探析具有重要的理论研究和实际应用价值。本文结合机器学习算法对校园一卡通消费数据进行探索研究,为高校管理者实现贫困学生精准识别、学生学业风险预估提供了新的思路。本文主要做了以下工作:(1)多方采集论文所需要的数据,并对获取到的校园一卡通消费记录、学生奖助学金评选结果等原始样本进行预处理,得到符合模型要求的数据输入。(2)为了解决逻辑回归模型的特征工程问题,构建一种基于LightGBM和逻辑回归的预测模型,并利用Sklearn调取OVR封装函数实现了逻辑回归的多分类,同时设置好模型的参数及评价指标。从UCI中选取六个不同的公共数据集(Breast Cancer Wisconsin、Diabetes、Heart Disease为二分类数据集,Seeds、Wine、Wall-Following Robot Navigation为多分类数据集),分别用LightGBM模型、LR模型和LGB-LR模型在六个公共数据集上训练,并结合5-fold交叉验证法对模型进行了验证。通过评价指标评估LGB-LR模型在六个公共数据集上的预测效果,得到LGB-LR模型性能在LightGBM模型、LR模型的基础上有所提升的结论。(3)为了验证逻辑回归在不同特征选择方法下的预测性能,构建基于1L惩罚项的逻辑回归模型和基于PCA的逻辑回归模型,并与LR模型、LightGBM模型和LGB-LR模型一起进行对比实验,结合贝叶斯优化调参得到模型最优参数,最后利用10-fold交叉验证法进行模型验证。针对贫困识别问题,LGB-LR模型的准确率、F1值和AUC值分别为89.54%、87.49%和0.87,各项指标几乎全部高于其它四个模型,仅在F1值上略低于LightGBM模型。针对学业预测问题,LGB-LR模型的准确率(微平均)和宏平均分别为77.72%、73.82%,略低于LightGBM模型,但相较其余三个模型更优。综上可得,LGB-LR模型预测效果相对理想,特别适用于处理二分类问题。而在处理多分类问题上,其准确率及宏平均值均高于其它几种特征选择下的逻辑回归模型,说明LGB-LR模型对高校学生贫困精准识别和学业风险评估有一定的参考价值。当然,本文中使用到的逻辑回归模型在多分类问题上还存在一定局限性,增加数据来源多样性和提高多分类模型预测精度是本文今后的研究重点。
其他文献
在高校法学专业教学中融入课程思政理念,有助于培养德才兼备、全面发展的高素质法治人才。通过教学改革与实践创新,作者明确"环境与资源保护法学"课程思政的教学目标、课程思政的教学内容,设计有效的课程思政实践路径,实现专业知识教育与课程思政的有机融合,期望为教师在法学专业课程中开展思想政治教育提供有益的参考。
学位
近十年来,随着畜牧养殖业的快速发展,机器视觉技术在畜牧养殖业中已经取得了较快发展。为加快养殖信息化技术在生猪养殖中的发展,改善传统生猪养殖中猪只人工统计工作的不足,实现更高效率的猪只识别与计数,本文基于机器视觉技术使用YOLOv3目标检测算法实现对猪只的识别与计数。本文主要的研究内容可以概括如下:(1)研究深度学习目标检测算法的工作原理和特点,比较不同算法之间的优缺点,选择YOLOv3作为本次实验
学位
非酒精性脂肪肝病(non-alcoholic fatty liver disease,NAFLD)是目前最常见的肝病之一。近20年来NAFLD发病率不断增加,且呈现出越来越年轻化的趋势,甚至在儿童中也有出现。NAFLD还有可能进一步恶化发展成为非酒精性脂肪性肝炎(non-alcoholic steatohepatitis,NASH),肝硬化,甚至是肝癌。其中NAFLD患者中有20%,可能进一步发展
2019年我国的汽车保有量总量达到2.6亿辆,全球汽车保有量也连年突破新高,汽车检修市场日益增大。而在传统车辆检修行业的检修流程中,存在纸质检修单污染、容易错检漏检、检修流程复杂、检修效率低下等问题。为了解决上述问题,结合语音识别技术设计了一款车辆检修管理系统,实现了检修流程的无纸化、电子化,降低了检修成本,简化了检修流程,提高了检修效率。车辆检修管理系统基于C/S客户端服务器模型架构,基于WPF
语文新课程标准提出普通高中语文课程应适应社会对人才的多样化需求和学生对语文教育的不同期待,并具有相对稳定的结构和富有弹性的实施机制。本文针对传统教学法的弊端,通过讨论交还提问权利、纵横对比探究、创设任务情境等教学模型在课堂实践中的应用,探究普通高中语文诗歌鉴赏教学的较优策略,为在更宽广空间培育学生的语文核心素养,发展学生的语文特长和个性提供借鉴参考。
学位
根据某款农用运输车的用户反馈,其前悬架板簧在服役期间经常发生失稳断裂问题,严重影响行车安全、提高后期使用成本,并且原结构基于经验设计存在过度设计,质量过重,造成材料浪费,与国家针对车辆实行的节能减排政策背道而驰,所以对其进行重新设计以满足使用要求。本文首先从理论层面验证原车钢板弹簧结构参数是否合理,并从材料力学角度对性能进行理论计算。根据厂家给出原始尺寸数据在UG中建立参数化三维模型,后将模型导入
学位