基于Apriori算法的课程成绩关联规则挖掘研究

来源 :中国科技博览 | 被引量 : 0次 | 上传用户:virtualboxscdl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要]数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,采用关联规则的Apriori算法和改进后的Apriori算法对郑州职业技术学院学生各门课程成绩进行分析,从而发现课程之间的联系和基础课程对专业课程的影响,为教务昔理部门安排课程 提供参考。
  [关键词]数据挖掘 学生成绩 关联规则
  中图分类号:TQ597.5 文献标识码:TQ 文章编号:1009―914X(2013)34―0508―01
  高校教务管理系统每学期都会产生大量的学生成绩数据,这些数据主要用于记录学生在上学期间的学分等学籍档案,其潜在的使用价值还远没能得到充分的挖掘和利用。仔细研究每学期学生的专业基础课和专业课成绩数据,我们会发现学生对于这两类课程的学习存在着一定的关联与前后顺序关系,不同专业、不同年级的专业基础课和专业课课程之间也存在着关联以及不同专业学生对于该类课程的选取也存在着一定的模式。
  1、经典关联规则算法
  为了更加有效地利用数据库中的数据,从数据库的相关数据集中提取出更高层次的大量的有关学院各专业学生的基础课与专业课成绩的潜在规则,找出它们之间的一些规律和影响学生成绩的深层因素,下而详细介绍经典Apriori算法如何挖掘学生教务成绩来说明课程之间有一定的关联和前后顺序关系。
  1.1算法思想
  Apriori算法是最经典的关联规则挖掘算法,是由A}rawal首次提出的,是基于计算候选集的递推方法,其思想是利用已知的高频数据集推导其他高频数据项集,是一种宽度优先算法[2]。该算法的主要工作在于寻找频繁项集,它利用了频繁项集的向下封闭性,即频繁项集的子集必须是频繁项集。
  在该算法中调用Apriori}en(Lk-1)是为了通过k-1频繁项目集产生k一候选集。该算法主要由拼接和修剪完成。
  1.2应用勺riori算法对学生成绩进行挖掘
  学院各类课程的信息中的数据项存在一定关系。木算法挖掘的目标是基础课与专业课之间的关联,应用该算法分析学院学生各类课程中可能存在的各种关联以及各种关联的程度如何,从而进一步分析其中存在的因果关系。规则1说明:((C语言》、《数据结构》的分数在80分以下的,则《计算机软件基础》课程的成绩也在80分以下,这条规则的支持度是34.5%,置信度是92.3%;该规则与实际教学经验相符合,说明《C语言》、《数据结构》的学习与《计算机软件基础》有较强的联系。因此相关教研室在制定教学计划时应考虑《C语言》、《数据结构》课程的学时应不得少于《计算机软件基础》的学时;同时《C语言》、《数据结构》课程的开设时间应先于《计算机软件基础》课程的开设时间。
  应用Apriori算法对学生成绩进行挖掘从一定程度上说明了某些基础课与专业课之间的关联,比如某些基础课学不好导致某些专业课分数也较低的规则可信度较高。学生课程的分数虽有较大的人为因素,比如对于某些学生较难学、不易理解和接受的课程,分数普遍较低,但总的来说,挖掘的规则有一定参考价值。
  2、关联规则挖掘算法的改进
  2.1Apriori算法的缺陷
  经典关联规则Apriori算法在大量数据的挖掘过程中,必须经过逐层的重复连接与运算步骤,才能找出所有的频繁项集。它在每一层中都会先产生大量的候选项集,而每一个候选项集又都必须与数据库中的每一笔事务记录做比较,不断地扫描数据库以找出所有符合最小支持度限制的频繁项集,直到找出所有频繁项集,而后再利用这些频繁项集探讨事务之间的关系,推导出所有的关联规则。该算法的特点是反复与数据库中的事务记录比较,耗费大量的时间与内存空间。
  2.2挖掘结果的运用
  我们以郑州职业技术学院教务管理中的学生成绩库中生成的成绩数据为样木,采用改进的Apriori算法得到《C语言》成绩80分以上的学生,《数据结构》成绩也是80分以上的可能性近50%,这样相关授课教师就可知道这两门课程之间存在一定的联系。同样,我们可以看到其它课程之间的关联,所以教务管理人员以及教研室教师可以通过合理安排相关课程的开课时间、加强前期课程的教学来提高后续课程的学习效果,这对于教学计划的修订起到一定的提示作用。改进的Apriori算法挖掘结果以文字及图表的方式对大多数学生的学习成績进行挖掘,提供给教务管理人员及相关教研室对课程进行优化处理,调整各课程之间的关系,使其更加符合学生的学习习惯。对某一个特定的学生用改进的Apriori算法挖掘可以使教师掌握该学生对于某门课程的学习状况和学习进度,可以对该学生进行学习建议。
  3、实验结果及分析
  我们以郑州职业技术学院2006级计算机应用技术专业学生的经过预处理后的成绩数据作为数据源进行仿真实验,学生成绩记录4200条,运用经典关联规则 Apriori算法和改进后的Apriori算法,从中分别抽取830 } 1330 } 1830 } 2330 } 2560五组事务记录条数,采用同样的最小支持度对学生各类不同课程成绩记录进行对比挖掘实验来挖掘各类课程的相关性。运行环境为256MB主存、WindoweXP,2GHz的CPU,不同记录条数在两种不同算法中的挖掘结果得出了采用同样最小支持度对于不同事务记录条数进行比较时,两种算法在执行时间方而的区别,从实验结果来看,改进的Apriori算法实现了预期的目标,与同类算法相比,该算法具有挖掘结果准确、速度快、运算量小、时间短、空间利用率高等特点。同时该图也反映了这两种算法的最小支持度与时间的关系:最小支持度越高,所需要的时间越多;对于不同的最小支持度,改进Apriori算法所需时间比经典Apriori算法所需要的时间短。通过以上分析,综合关联规则挖掘结果,得到如下结论:学生的学习成绩与课程之间存在很大的关系。加强基础课程和专业基础课程教学,有助于学生后续专业课程的学习和提高。
  4、小结
  木文主要对学院在校学生成绩分析与预测的关联规则进行了挖掘,在挖掘该问题的过程中,将经典的Apriori算法与改进后的Apriori算法进行了比较与分析,比较结果证明了改进后的Apriori算法在程序运行的时间效率上明显提高,同时从海量数据中挖掘出基础课程与专业课程的关系,得出一些具有价值的规则和信息,最终找到影响学生成绩的原因,并在此基础上对课程设置做出合理安排。
  参考文献
  [1] 康俊霞.关联规则挖掘算法在教学上的应用[J].河北工业科技学院学报,2008(4).
  [2] 土伟勤,郑海A}Y'lOY'1算法的进一步改进[J].计算机与数字工程,2009(4)
  [3] 吴斌,肖刚,陆佳炜.基于关联规则挖掘领域的算法的优化研究[J].计算机工程与科学,2009(6).
  作者简介
  王玉林,(1992-09),男,河南省新乡市人,郑州大学信息工程学院2010级软件工程专业本科生。
其他文献
[摘 要]在现代林业发展中,要更好的协调林业的社会公益职能与私人生产的利益关系,更多的通过利益诱导,而不是利益限制,实现保护和发展资源的目的。使森林培育业能获取社会平均利润,保护林业经营者的合法权益,解决经营林业的动力机制和激励机制,把林业保护和林业生產密切结合起来。  [关键词]现代林业 林业生产 林业保护  中图分类号:V271.3+1 文献标识码:V 文章编号:1009―914X(2013)
期刊
[摘 要]国有企业不断加大了对职工培训的投入,使职工队伍的能力、素质基本适应了企业的发展需要,要提高企业的应变能力,就需要不断提高员工素质,使其能够在发展中适应内外环境的变化,而员工培训正是提高员工素质最有效的方法之一。从企业培训现状看,缺乏正确的培训理念和创新的培训管理体制,是影响企业培训效率的重要原因,笔者就如何针对企业培训中存在的问题,树立正确的培训理念、建立健全的培训体系等问题进行探讨。 
期刊
[摘 要]由于购物卡具有使用方面的便利性而受到消费者的青睐,购物卡券逐渐成为一种普遍的经济现象。然而,购物卡的使用也给人们带来了一些弊端。例如购物卡以 “此卡不记名,不挂失,也不予补办”,导致许多消费者购物卡丢失时无法维权。那么对购物卡丢失不予掛失这一事实,如何定性,消费者可否维权,如何维权已经由一个个别问题上升到普遍的社会问题,由一个道德上的问题上升了法律上的问题。  [关键词]购物卡 消费者
期刊
[摘 要]供用电技术专业是一门行业性极强的专业,掌握行业发展方向,了解社会对人才的需求,是制定人才培养方案的依据;本文主要就供用电技术专业的人才培养目标、人才培养模式、工学结合的教学改革等方面进行了探讨。  [关键词]供用电 高职院校 教学改革  中图分类号:C41 文献标识码:C 文章编号:1009―914X(2013)34―0509―01  1、课程改革思路与人才培养目标、模式  1.1 坚持
期刊
[摘 要]我国在物理实验教学的改革中,一直都存在实验教学的低效、无效的现象,有时实验教学只是流于形势,同学们只是出于玩儿的形势,教师以讲课代替实验等的现象很普遍。随着我国对教育的重视,已经不再是教授学生固定的教学课本知识,而是主要注重对学生自由价格的塑造。而当前学校教育的主要任务应该不是以升学率为重点,而是应该教会学生学会学习、做人、做事、生存等。而物理实验教学的责任也十分的重要,主要应该分析教学
期刊
[摘 要]随着计算机技术地不断发展与进步,计算机已经在职业院校教学中得到普及与广泛地应用。本文首先对当前时期下职业院校计算机教学的现状进行了分析,然后着重阐述了职业院校计算机三大教学方式,旨在为职业院校计算机教学方式的选择提供一定的科学依据与参考。  [关键词]职业院校计算机 教学方式 课堂实效性  中图分类号:O4-39 文献标识码:O 文章编号:1009―914X(2013)34―0511―0
期刊
[摘 要]本文从混凝土产生质量缺陷的各种原因及预防措施入手,对混凝土施工质量控制进行了详细的探讨。  [关键词]工民建 混凝土施工 补救措施 质量控制  中图分类号:U213.3+4 文献标识码:U 文章编号:1009―914X(2013)34―0494―02  前 言  近年来,我国公路沥青混凝土路面常见病害十分突出,由于车辆荷载,水和溫度等变化等自然因素的作用和施工过程中的质量问题,沥青混凝土
期刊
[摘 要]本文以某水电工程为例,简要介绍了水电工程竣工环境保护验收调查实施方案的要点内容,包括:调查方法;调查范围;验收标准;调查重点;环境敏感目标;环境影响报告书及其批复意见的回顾;调查内容等。  [关键词]水电工程 验收调查 实施方案 要点  中图分类号:X508 文献标识码:X 文章编号:1009―914X(2013)34―0504―01  某水电工程位于某江干流上,电站装机容量1350MW
期刊
[摘 要]随着时代的进步,教育改革的实施对现行的教育提出了更高的要求。我国教育在新课改的实施中,初中数学教育教学的方法也随着改进。数学教学要求教师创造情景,引导学生积极思考,发散个性思维,并与学生相互互动,促进教学过程完整进行。立足当代中学教学的现状,结合具体的实际情况,以构建理论实际为指导,从选择适当的教学方法及运用现代化手段等几个方面进行分析并提出看法。  [关键词]初中数学 教育教学 方法思
期刊
[摘 要]河北省是我国的一个农业大省,同时又是一个农业灌溉用水占总用水71.20%且水资源极度缺乏的省份,地貌复杂多样,高原、山地、丘陵、盆地、平原类型齐全,有坝上高原、燕山和太行山山地(以下称山丘区)、河北平原三大地貌单元。经过60多年的水利建設,河北省山丘区水资源开发利用能力逐步加强。截止目前,山丘区已建成蓄、引、提、井等水利工程,节水灌溉工程形式包括低压管道输水灌溉工程、喷灌工程、微灌工程和
期刊