基于大数据的大学生行为分析

被引量 : 0次 | 上传用户:wuyonghong1974
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在很多行业中,大数据都发挥着重要作用。大数据被用于医院、大学、餐厅、银行等场所,大数据的存在对于现代人工智能下的互联网系统非常重要,尤其是教育系统。现在,国内外大学每时每刻都在产生与大学生、工人和教师的日常生活相关的大量数据,对这些数据的合理应用有助于大学教育的管理。本研究所使用的大数据是兰州理工大学的相关数据。主要关注图书馆数据、校园内学生卡的消费、学生成绩和学生入学信息等方面的数据。通过对这些数据的处理和分析,对学生的行为进行全面的研究。通过清理和合并所有数据将学生数据划分为四个方面:成绩、借书数量、学生专业和每年消费数据。本文工作中,首先使用FP-Growth挖掘工具获取本研究所使用数据,使用Rapid Miner工具和Python语言(Pandas包)来获取数据之间的关联,并选择最有价值的特征来预测学生行为。然后,使用K-means算法对学生数据进行聚类,根据聚类结果挖掘不同学生的学习成绩、图书借阅数据和校园卡消费数据之间的关系,以及不同学生之间的行为差异。使用肘部方法来确定K均值的最优聚类数。之后,学生现有的实际成绩被用来预测他们下一年的成绩。在这一步中,使用逻辑回归(LR)、随机森林(RF)、朴素贝叶斯(NB)和神经网络(NN)进行预测。神经网络的准确率为77%,朴素贝叶斯的准确率为76%,逻辑回归的准确率为77%,随机森林的准确率为76%。结合逻辑回归(LR)、随机森林(RF)、朴素贝叶斯(NB)和神经网络(NN)的特点,提出了一种新的分类模型,根据学生的行为预测学生的表现。本文提出的新的多分类模型的准确率达到了78%的准确率,与其他分类模型相比,其性能最好。最后,分析预测结果并计算特征重要性排名,实验结果表明,数据特征重要性排序依次为:学生的图书借阅量,学生专业,最后一学年的成绩,卡消费金额的负重要性特征值。基于特征重要性方法的结果表明,鼓励学生从图书馆借阅书籍并选择符合他们兴趣和优势的专业是有帮助的。此外,教育学生过度支出对学习成绩的潜在负面影响是有用的。
其他文献
学位
学位
学位
学位
学位
学位
随着我国经济发展进入新常态,许多产业面临着产能过剩、结构不合理、发展质量低、效益差等诸多问题,如果这些问题得不到解决,我国的经济发展就可能陷入“中等收入陷阱”。理论与实践已经证明,技术创新是解决这些问题的关键。习近平总书记在十九大报告中指出,“创新是引领发展的第一动力”,必须“以供给侧改革为主线,推动经济发展质量变革、效率变革、动力变革”。当前我国正在大力推进供给侧改革,反映在产业层面就是要改善产
学位
目的 基于logistic回归模型研究前列腺癌根治术(RP)术后并发尿路感染的危险因素及计划-执行-检查-处理(PDCA)循环管理模式的护理策略,为RP患者术后护理提供参考。方法 选取2019年4月—2023年1月于海南医学院第一附属医院行RP手术治疗的284例前列腺癌患者为研究对象,采用随机数字表法将其分为对照组和观察组,各142例。术后对照组接受常规护理,观察组加用PDCA护理模式,比较2组术
期刊
党建引领基层社会治理关系着党的自身建设和人民群众的切身利益。创新党建引领基层治理的路径也是实现中国式乡村现代化的必然要求。本文以江苏省丰县小韩村党建引领基层社会治理为例,梳理了近些年小韩村在党建引领基层社会治理中积累的实践经验,并提出了创新的路径。
期刊
近年来,由于能源资源的不断减少,世界各地气候的变化,环境问题逐渐引起了世界各国的关注,其中对于生态环境危害较大的根源之一,就是由于不可再生能源的使用所引起温室气体的排放,比如汽车尾气。在这种发展状况下,加之政府对电动汽车的支持和人们对环境保护意识的强化,电动汽车的数量不断增长,对于电动汽车充电桩的需求也越来越大。但是大规模的充电桩接入电网,不仅会对电网的安全运行造成威胁,而且会加大电网用电量的峰谷
学位