量化关联规则模型与挖掘算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:zouyongchina
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘的研究一直是数据挖掘领域的研究热点之一。它主要是指在满足最小支持度和最小信任度的条件下,从数据库中挖掘出如“购买物品A和B的客户80%同时也购买C和D”这样的规则。早前这方面的研究大都以事务数据库为主要对象,其属性局限于布尔类型。在科学计算和商业领域的数据库中属性类型较为丰富,且多为数量属性和类别属性,属性取值不再是布尔量0或1。在这样的数据库中进行关联规则挖掘称为量化关联规则挖掘。较之布尔关联规则挖掘,量化关联规则挖掘具有更为普遍的意义。本文主要研究工作如下:(1)研究了量化关联规则模型,分析总结了当前量化关联规则挖掘的研究现状,并重点研究了一些挖掘算法,总结了这些算法的优势和存在的不足。(2)针对量化关联规则挖掘中对不同量化属性的划分区间进行链接,计算支持度等操作时间开销大,导致算法执行效率不高的问题,提出考察属性间互信息值,并基于强信息关系属性挖掘量化关联规则的挖掘算法BMIQAR。实验表明,算法BMIQAR有效地减少了挖掘过程中的计算量,提高了算法的性能,并且能得到绝大部分置信度较高的规则。(3)针对现有的量化关联规则挖掘方法仅从项目的权值或数量某个方面考虑,不能挖掘出满足某些特定要求的关联规则的问题,提出将项目数量与权值进行整合,在K-获利支持期望的概念基础上设计的基于获利最大化的量化关联规则挖掘算法WQAR。实验表明,WAQR算法得到的是那些真正获利最多的项目组合,而由这些项目组合得到的规则也是获利项目间的关联知识。
其他文献
当今企业应用系统常常陷入进退维谷的境地,在企业应用系统开发中,总遇到“不敏捷”和“效率不高”的情况。企业不能依赖IT基础结构来快速满足业务需求的变化,缺乏有效应对市
随着互联网和信息通讯技术的不断发展,全球进入信息化时代,为了迎接新时代的知识革命,各高校纷纷构架自己的信息高速公路。数字图书馆、校园一卡通、办公自动化、目录服务系统、
软件测试是控制软件质量的重要手段,软件质量的好坏将最终决定软件企业的市场命运。因此为了保证软件产品的质量,软件测试特别是自动化测试越来越受到人们的重视。软件自动化测
领域工程和MDD(Model-Driverl Development)是目前使用的两种先进的程序开发方式,领域工程和模型驱动的开发方式,简单来说就是以建立领域模型为主要手段的开发,然后通过模型
软件测试模型是用于指导软件测试过程如何开展的理论模型。本文分析嵌入式软件的特点,综述传统的软件测试方法;针对嵌入式软件的特点,对传统模型的缺点进行改进,构建嵌入式软
随着全球信息化的快速发展,各种各样的软件系统已经进入社会的各个领域。企业,政府等机构经过了多年信息化发展,已经拥有了各种软件资源,与此同时人们的工作方式也由过去人与
Web服务是一种通过标准协议用以保证互联网上异构平台间的应用服务可进行互操作的技术。随着互联网以及Web服务技术的快速发展,企业的开发需求不断更迭,因此,Web服务的数量也正
随着移动通信技术的发展,移动节点间通信的安全性日益成为人们关注的热点。其中移动自组网的安全通信,更是研究的重点。作为现有通信领域内常用的体系,PKI(Public Key Infras
目前,主流的信息检索系统都是基于语法层上的关键词匹配或者内容分类目录的检索技术,导致计算机无法理解信息的语义内容,存在信息的误检、漏检等缺陷。为了使检索具有智能性,
随着计算机技术和网络技术的迅猛发展,计算机系统已经从独立的主机发展到复杂的、互联的开放式系统,入侵检测的问题变得越来越突出。生物免疫系统基本功能是识别自我和非我,