论文部分内容阅读
近年来,随着我国大众化高等教育的普及,高考考生数量的激增,给面向高考招生的数据分析与管理工作带来了诸多问题。数据挖掘技术是一种从大量的数据集中,提取隐含潜在的有用信息和知识的过程,为决策支持服务,并已得到广泛的应用。本文在对山西省历年高考招生数据及数据挖掘方法进行分析的基础上,将数据挖掘技术应用于面向高考招生的智能数据分析进行了研究,取得了较好的效果。主要研究工作为:一、在对现有高考数据管理方法深入分析的基础上,设计了面向高考招生的智能数据分析系统,并给出了系统的功能模块、实现技术及运行环境等。二、给出了一种基于支撑向量机(SVM)的招生人数智能数据分析方法。该方法首先,通过非线性映射将考生信息向量映射到一个高维特征空间;然后,选择合适的核方法尽量减小预测误差,并结合数据分布特征通过训练得到所选核方法相应的参数;最后,基于上述思想开发出SVM仿真子系统,对输入的各年度各院校各专业计划招生人数、报考人数和实际招生人数作为输入变量,对下一年度招生情况进行预测。三、给出了一种基于粗糙集理论的高考单科成绩智能数据分析方法。该方法首先,运用离散归一化法对高考单科成绩数据进行预处理;其次,利用信息熵给出条件属性中哪些属性最大程度地改变了决策属性和分类,以此来确定哪些条件属性最重要;最后,对某门高考招生课程成绩的各个部分进行了分析,得到对整体成绩影响最重要的部分,从而可以进行客观的决策。在上述研究开发的高考智能数据分析系统中,应用支撑向量机方法模拟了真实的山西省高考招生数据,预测下一年度各院校的招生人数,从而为各大专院校制定相关的招生计划提供参考依据;应用粗糙集理论对山西省高考考生成绩进行了分析,从而为进一步完善高考成绩管理系统提供技术支持。