论文部分内容阅读
在现代化的高等教育管理中,信息化水平逐年提高,随着校园一卡通的广泛使用以及历年各大业务系统数据的积累,形成了校园大数据环境。主要体现在学生的数据大规模、多类型、高速度、低密度价值几个特点,如何有效挖掘学生一卡通数据成为提升学生工作信息化管理水平的重要内容。本课题主要研究本科学生一卡通数据及相应的业务系统中保存的在校学生的各种行为(学习行为、生活行为、心里行为)数据,数据包括学生的消费数据、校医院看诊数据、进出门禁数据、图书馆借阅数据、考试成绩、上网时长等海量数据。分析数据探究学生学习、生活和心理等方面的相关关系,挖掘学生异常数据、反馈异常数据,充分利用学生在校行为数据建设数字校园、智慧校园,使得校园信息化水平得以提升。本文通过搭建学生行为大数据分析系统,以中共北京市委教育工作委员会首都大学生思想政治教育研究课题《大数据视角下高校学生工作一卡通数据分析与应用》为依托,对学生在校行为数据进行挖掘研究,主要完成以下内容:(1)整合学校各大业务系统历史数据,结合学生在校一卡通中的各类数据进行分析,并对异常数据进行相关处理。(2)研究大数据框架Hadoop的HDFS文件系统和MapReduce计算模型,搭建基于Hadoop技术的高校学生行为大数据分析系统的总体技术架构,并利用计算模型MapReduce对高校学生行为数据进行挖掘处理。(3)将学生行为数据测点进行归约,梳理不同行为之间的关联关系,绘制学生在校的“学生画像”,清晰的描绘学生在校情况,关联分析学生的学习情况、生活状态以及心理动态之间的关系。(4)构建高校家庭经济困难学生认定模型,利用模糊评价方法隶属度的概念结合大数据分析系统中的学生一卡通消费数据和家庭情况调查表中的数据,确定学生隶属等级,通过隶属度的相对大小来确定其贫困等级。(5)实现学生行为大数据分析系统,分析总结学生行为规律与特性,提出具有建设性的参考意见供相关部门分析,以便于分析学生行为特点,及时的指导学生行为全面健康的发展。(6)完成大数据分析系统在学校家庭经济困难学生认定工作中的实际应用,利用模型认定的方式代替辅导员以往凭借经验认定的定性分析,将认定工作定性化向定量化转变,提高学生工作的效率和认定结果的科学性及可靠性。