论文部分内容阅读
本文通过实地调研校园卡系统的发展现状以及系统架构,深入了解校园卡系统的硬件、软件、网络以及数据库的运行模式和数据采集机制。进而从校园卡系统中获取可进行挖掘的源数据,经过数据清洗、筛选后,将系统中统计出的学生使用校园卡产生的原始计数数据转换为二分类变量数据,然后使用Apriori关联分析算法,对二分类变量处理后的五类变量进行数据挖掘,找出潜藏在数据背后的可循规则,挖掘出学生日常行为轨迹中影响成绩的因素。并就得出的分析结果进行解读,针对所发现的问题,为教育管理者提供相应的教育策略,将校园中琐碎的数据充分的利用起来,为高校实现适应时代需求的信息化教育和教学管理方式提供有价值的建议,更好的推动学校整体的发展和学生学业水平提高。本文的研究选取了某学院同一年级各班的学生为样本,样本总量为226,每个样本有五类变量,分别为成绩、饮食规律、作息规律、进入图书馆次数、借阅图书次数。将每班学生按成绩排名分为好与一般,取所有样本吃早餐次数的平均值为标准,大于且等于此标准的样本,饮食规律标为好,小于此标准的样本,饮食规律标为一般。取所有样本超过晚上十一点回宿舍次数的平均值为标准,大于等于此标准,作息规律标为一般,小于此标准,作息规律标为好。同理,样本进入图书馆次数和借阅图书的次数大于等于所有样本平均值的,样本此项的值都标为好,小于平均值的,标为一般。将整理出的数据表导入SPSS Modeler建模软件,使用Apriori关联分析算法建模,调整参数后,运行模型,最终得出四条后项为成绩的关联规则,即进出图书馆次数多、借阅图书多和饮食规律好→成绩排名好(S=17.3%,C=87.2%);饮食规律好、借阅图书多、作息规律一般→成绩排名好(S=17.3%,C=84.6%);借阅图书多和进入图书馆次数多→成绩排名好(S=20.8%,C=80.9%);作息规律一般、饮食规律一般和进入图书馆次数少→成绩排名一般(S=18.1%,C=80.5%)。作息规律一般、进入图书馆次数少和饮食规律一般这三个因素没有对成绩排名一般造成直接的影响,每个因素与其他两个因素并发时才会有很大的概率导致成绩排名的一般。借阅图书少这个因素无论是否与其他因素并发,都没有对成绩一般造成影响。有效关联规则中有四个影响成绩排名好的因素,分别是借阅图书多、进入图书馆次数多和饮食规律好以及作息规律一般,前三种因素需要同时满足条件,或是借阅图书多和进入图书馆次数多这两个因素需要同时满足条件。而作息规律一般与其他因素同时满足条件后,对成绩排名好产生了影响,这个结果乍一看不符合常理,但正是说明了成绩排名好与成绩排名一般的学生都普遍有熬夜的习惯,就寝时间比较晚。针对发现的此类问题,教育管理者就可以利用数据对学生制定相应的教育政策。引导、教育学生养成良好的作息规律。本研究中,样本的饮食规律、作息规律、借阅图书次数和进入图书馆次数这四类变量并没有单独直接影响成绩的排名。