论文部分内容阅读
随着社会的进步,越来越多的新兴技术突涌而出,大数据技术是继云计算和物联网之后的又一大技术革命。大数据技术正在通过其数据分析挖掘和预测能力改变人们的生活和学习方式。互联网时代的各行各业都在产生着大数据,这些数据都是宝贵的资产。由于高校信息化建设不断完善,各大教学管理系统和平台也在不断更新和完善,导致高校数据库数据爆炸式增长,教育大数据应用环境已在各大高校初步形成。但很多高校对校园数据并没有合理利用,使这一宝贵的资源常年沉睡。在此背景下,合理利用校园大数据,挖掘校园内产生的教育大数据的价值,已成为当下非常有意义的研究课题。因此,本文提出了高校学生行为大数据分析与挖掘的研究方案。通过挖掘学生行为数据,找出数据与数据之间的关联关系,为高校和学生的全面发展提供强有力的帮助。笔者在研究中首先利用R语言技术对集成后的校园数据进行综合数据治理,接着进行数据清洗和数据质量的管控,形成完整的信息链条。然后采用K-means聚类算法和Apriori关联规则算法定制面向师生的数据挖掘分析模型,建立不同主题的数据挖掘类应用服务。本研究在完成高校不同数据集分布式管理的同时,也完成了教育大数据的深入分析和挖掘。分析学生数据,及时掌握学生的情况,对学生的行为发展进行预判,合理指导开发教学方案,真正做到因材施教,更好的指导学生发展方向。论文第一章主要对研究背景、研究综述、研究目的和意义以及研究思路与研究方法进行阐述。第二章主要围绕大数据在教育领域应用展开理论探讨,包括理论基础和对大数据的定义等做出系统阐述。第三、四、五章是论文的主体,主要描述大数据技术在教育领域的应用,笔者以某校的某部分学生为研究对象,利用大数据技术对学生在校园内的行为数据开展实例研究。第六章是论文的总结,主要内容包括研究局域以及对教育大数据应用展望的说明。