论文部分内容阅读
该文在充分分析数据挖掘的基本特点和相关技术的基础上,探讨了事务间量化关联规则挖掘的理论及其在预测中的应用.该文首先介绍了国内外关于知识发现和数据挖掘的最新发展动态、数据挖掘的基本概念和一般处理流程.通过对事务间关联规则理论的分析,发现其适用对象仅仅为分类属性,因而有所限制,基于原来的事务间关联规则概念和算法,我们提出了事务间量化关联规则的概念及挖掘算法,从而将分类属性和量化属性统一到了一起,扩展了它们的应用范围;然后引入了部分完全性度量和分箱技术对属性进行动态离散化,在保证信息丢失最小化的前提下,有效地压缩了算法的搜索空间,对于算法搜索产生的海量规则,采用基于特化的R—兴趣度度量来剔除冗余规则;再者,因为数据挖掘本质上是一种数据分析技术,单纯的数据挖掘技术缺少用户的参与,因而不能得到他们的期望结果,据此我们引入多维数据分析的OLAP技术,将它与关联规则挖掘技术紧密地集成在一起,形成了一个对用户友好的、交互式的数据挖掘环境.最后,我们将上述理论应用到武汉市空气质量预测系统Orpheus中,取得了较好的效果.