论文部分内容阅读
作为高校非计算机专业学生必须通过的一种计算机水平考试——高校计算机等级考试,是由教育部所属全国各省、市、自治区教育厅主持、各高校考务办公室具体负责组织实施的。考试每年举行两次,目前各高校教务部门积累了大量与考试相关的数据,但对这些数据的利用大部分只停留在成绩的上报、备份、统计和查询等,隐藏在成绩背后与成绩有相关联如学生数据、课程数据、教师数据、考试数据没有得到全面挖掘,对考试、教学潜在有用价值的信息没有得到充分利用。全面的、深层次地对这些数据进行挖掘,找出潜在的影响高校计算机等级考试成绩的重要关键因素和有用规则,不仅利于提高考试的通过率,而且利于提高教学质量。数据挖掘技术是数据库、人工智能、信息检索等多领域结合发展的新技术。使用它可以从数据库中存在的大量信息挖掘出潜在的知识或者发现有用的规则。数据挖掘技术不仅可以对历史数据作出描述,也可以对未来数据作出预测。决策树是数据挖掘技术中的常用的技术,已经广泛应用于不同领域。本文通过发放问卷调查表方式获取学生信息数据,通过教务管理系统获取学生成绩数据,以这两部分数据为数据源,借助数据挖掘工具软件SPSS,使用决策树技术CRT方法及计算机编程语言的相关技术,对高校计算机等级考试成绩及其相关信息进行数据挖掘。然后综合运用概率论、数理统计知识等对挖掘的数据及结果分析研究,作出科学合理的解释。本文研究的结果建立了高校计算机等级考试成绩合格的分类模型,找出潜在的影响高校计算机等级考试成绩的重要关键因素;发现了考试成绩合格分类的有用规则。根据这些规则,可以给学校相关部门提供考试管理和教学改革的理论参考,以便改善教学质量和考试管理水平;提高高校计算机等级考试的合格率。运用分类模型,可以预测学生考试的通过率。