事务间量化关联规则挖掘的研究及应用

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:violence211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文在充分分析数据挖掘的基本特点和相关技术的基础上,探讨了事务间量化关联规则挖掘的理论及其在预测中的应用.该文首先介绍了国内外关于知识发现和数据挖掘的最新发展动态、数据挖掘的基本概念和一般处理流程.通过对事务间关联规则理论的分析,发现其适用对象仅仅为分类属性,因而有所限制,基于原来的事务间关联规则概念和算法,我们提出了事务间量化关联规则的概念及挖掘算法,从而将分类属性和量化属性统一到了一起,扩展了它们的应用范围;然后引入了部分完全性度量和分箱技术对属性进行动态离散化,在保证信息丢失最小化的前提下,有效地压缩了算法的搜索空间,对于算法搜索产生的海量规则,采用基于特化的R—兴趣度度量来剔除冗余规则;再者,因为数据挖掘本质上是一种数据分析技术,单纯的数据挖掘技术缺少用户的参与,因而不能得到他们的期望结果,据此我们引入多维数据分析的OLAP技术,将它与关联规则挖掘技术紧密地集成在一起,形成了一个对用户友好的、交互式的数据挖掘环境.最后,我们将上述理论应用到武汉市空气质量预测系统Orpheus中,取得了较好的效果.
其他文献
该文提出了一套新的构件库管理体系:基于Web服务的构件库管理(WS-CLM).它建立在一个以分层的构件管理服务实体为核心的体系结构模型上,采用Web服务技术封装各个构件管理服务
随着Internet和www的快速发展,基于Web的信息系统变得越来越复杂,它们在关键的任务中也越来越发挥着重大的作用。 XML是为新一代Internet范围内的网络计算而设计的,在分布式
火焰是自然界常见的流体现象之一,火焰特效在影视动漫、安全教育、游戏等领域都有重要的应用。传统的基于物理的火焰建模方法,需要求解复杂的流体力学方程,因而需要大量的计算资
普及计算是自分布式系统和移动计算发展来的.在普及计算系统中,人们可以无论何地何地接入网络,使用计算能力.在这篇论文中,我们将讨论普及计算系统的结构和自适应的系统设计.
该文针对目前大型企业的信息化应用特征,同时结合具体企业环境的需求,在分析RBAC96模型与ARBAC97模型的基础上,提出了面向域的分布式RBAC模型(DODRBAC).在DODRBAC模型中,引入