论文部分内容阅读
信息化的高速发展推动了数字化校园的建设,校园一卡通系统的应用普及到了全国各大高校,覆盖了生活和学习等各个方面。系统每天都会产生大量的数据存储到数据库中,经过多年应用,系统积累了千万级乃至上亿级数据。这些数据中隐藏了用户的行为特征,如何利用海量的数据为学校的日常管理工作提供决策支持是目前亟待解决的问题。为顺应高校信息化的发展,本文运用数据挖掘技术对学生一卡通数据进行统计分析,完成了以下工作:(1)设计并搭建了基于J2EE平台的校园卡查询系统。为实现后期可视化系统的开发,在学校提供了 Webservice接口的前提下,利用Struts2+Webservice+J-UI框架完成了校园卡查询系统的功能开发,让广大师生能便捷的查询自己的消费明细和补助发放等信息,实现了办理业务的自助化和信息化。(2)校园卡基本信息可视化。为能直观地了解数据,方便后期的一卡通数据挖掘分析,选取食堂超市消费信息以及图书馆刷卡信息对全校学生的早餐时间规律、食堂刷卡次数金额、超市刷卡次数金额、图书馆刷卡次数做统计,分析了各年级不同性别群体的特征。统计了学生在不同时间段内的食堂刷卡消费频次和食堂就餐人数,分析了食堂的就餐峰值和容积率特征。(3)用户人群画像。本部分利用数据挖掘技术对学生校园消费和学习活动数据进行人群画像分析。首先通过数据预处理提取关键特征,进行标准化处理后,采用K-means聚类算法对全校本科生数据集进行聚类,分析了用户的消费习惯和人群特征后进行画像说明。最后,通过生成的决策树模型对本科生数据集进行分类,以评估人群特征划分的准确性。实际结果表明,本文设计的用户分类模型能有效区分不同行为特征用户,为高校学生管理工作提供依据。(4)食堂营业额预测。本部分利用我校校园卡刷卡数据分析食堂营业额规律,对食堂消费数据在时间纬度上的应用进行了研究,为促进数字化校园的发展,建立食堂突发事件预测预警系统提供了方案。使用食堂现有的每日营业额数据构建时间序列预测模型,对食堂未来营业额进行了预测,并通过对食堂营业额实际值与预测值的对比,验证了模型的合理性。