论文部分内容阅读
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。如果不借助强有力的挖掘工具,仅依靠人的能力来理解这些数据是不可能的。虽然目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。 数据挖掘正是为了解决传统分析方法的不足,并针对大规模数据的分析处理而出现的。数据挖掘从大量数据中提取出隐藏在数据之后的有用的信息,它被越来越多的领域所采用,并取得了较好的效果,为人们的正确决策提供了很大的帮助。 本文主要内容是对数据挖掘技术在中国教育经济信息网(CEE)中应用的研究,并在此基础上设计和开发了数据挖掘系统CEE Data Miner,简称CEEDM。本文结合数据挖掘系统CEEDM的设计与系统中作者负责实现的关联规则挖掘技术部分,对数据挖掘技术中的一些重要的概念、方法和策略进行研究,集中讨论了关联规则挖掘技术在CEEDM系统中的应用与实现,并针对Apriori算法的固有缺陷,对不产生候选挖掘频繁项集方法--FP-growth频集算法进行分析并加以实现。 本文的主要贡献主要体现在以下几个方面: ●成功的实现了数据挖掘技术在中国教育经济信息网(CEE)中的应用。 ●完成了对数据挖掘系统CEEDM的总体设计。 ●针对Apriori算法的固有缺陷,对不产生候选挖掘频繁项集方法--FP-growth频集算法进行分析并加以实现。