论文部分内容阅读
近年来随着我国高等院校招生规模的不断扩大,数据量急剧增多,从众多数据中自动获取有效的知识已成为制约高校招生工作进步发展的“瓶颈”。因此,建立高校招生智能决策支持系统,实现知识的自动获取具有重要的理论和应用价值。论文基于数据仓库和数据挖掘技术,通过数据仓库完成决策支持底层数据源的存储,同时提出种改进的Apriori算法,并利用此算法挖掘出数据中的有效知识,实现了高校招生决策支持系统的开发。论文的主要研究内容和创新点概括如下:(1)在深入分析了数据仓库和数据挖掘理论与技术的基础上,研究了基于数据仓库的高校招生决策支持系统框架,并以北京工业大学2005年-2008年学生的招生、学籍及就业数据作为数据源,根据对系统主题的分析,基于SQLServer2008平台设计并实现了面向对象的招生决策数据仓库,完成了北京工业大学招生决策支持系统的框架设计。(2)为了解决招生决策支持系统知识自动获取的问题,提出了种基于改进Apriori算法的数据挖掘方法。该数据挖掘方法首先针对学生加权成绩分档的问题,利用数据离散化方法可降低人为主观因素对挖掘结果的影响;其次,提出种改进的Apriori算法,通过建立字段与值的索引、扫描数据库获取数据快照、引入关联规则提升度以及增加字段的因果属性等方法,提高了改进Apriori算法的性能;最后,将改进的Apriori算法应用于招生决策支持系统的数据挖掘,提高了挖掘精度。(3)针对目前尚无有效高校招生决策支持原型系统的问题,通过所搭建的高校招生决策支持系统架构、数据仓库以及所研究的数据挖掘算法,以C#语言为基础,成功建立了基于C/S架构的北京工业大学招生决策支持系统的原型系统,实现了数据的有效分析与获取。