多最小支持度关联规则挖掘研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:huanghoubin101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与传统的统计、查询方法相比,数据挖掘是人工智能、模式识别、数据库、机器学习以及管理信息系统等形成的交叉学科。数据挖掘是一个新兴的边缘学科,其应用领域非常广泛,并且具有良好的应用前景。本文概述了关联规则挖掘,尤其对多最小支持度关联规则挖掘进行了深入研究分析,主要包括以下内容:关联规则研究分析。概述了关联规则挖掘的基本概念,分类讨论了关联规则挖掘算法,并分析了其中几种典型算法;对多最小支持度关联规则挖掘的基本理论、挖掘算法和研究现状进行了研究分析。针对多最小支持度关联规则挖掘,本文提出了一种多项目支持树(MIS-tree)结构模型,它能够储存关于频繁模式的关键信息。同时提出了一种基于MIS-tree的多最小支持度关联规则挖掘算法,即CFP-growth算法,用以挖掘所有的频繁项集。针对多最小支持度设置难的问题,本文提出了一种保持MIS-tree结构的稳定算法,该算法不需要再次扫描数据库,只需要不断的运行挖掘算法来调整支持度,以便对所有项目设置一个适当的支持度阈值。基于合成数据对CFP-growth算法的性能与Apriori算法、MSaprori算法、FP-growth算法进行了比较实验,并对实验结果进行了分析。结果表明CFP-growth算法挖掘效率高于原MSapriori算法。并对保持MIS-tree结构的稳定算法进行实验测试,结果表明比重新构建MIS-tree要节省大量的时间。
其他文献
测试驱动开发是极限编成的最佳实践之一,采用测试驱动开发,可以获得简单、清晰、高质量的代码,近几年来受到软件开发人员的推崇。Kent Beck作为极限编程的创始人,提出了测试
J2EE是整合企业级服务的优秀平台,它结合Java编程的多种优点和过去10多年大中型企业软件开发中的经验,提供了一种基于组件的、以服务为中心的、多层应用的架构。但事实证明,J2EE
近年来,我国汽车行业迅速发展,为了在竞争中立于不败之地,厂家不仅仅重视生产技术的发展,而且对售后服务的重视程度也不断提高,很多大型企业都建立了自己的售后服务体系。三包理赔
WWW的飞速发展使其已成为全球信息传播与共享的重要平台,并成为人们获取信息的主要来源。但是随着信息量的激增,要想从WWW上获取一条有用信息的难度却越来越大。人们期望着一种
本文从全文检索技术的产生、发展和应用入手,深入探讨了全文检索的基本原理、方法和特点。通过对全文检索引擎Lucene系统结构、索引结构及数据流程的深入研究,详细剖析了全文
传统可搜索对称加密方案允许用户将密文上传至云服务器存储,并根据需要委托云服务器实现安全的检索功能,取回包含指定关键字的密文,最后解密出相关数据。动态可搜索对称加密(
Web服务的出现是Internet技术发展的一次革命,使Web上的交互方式从以信息为中心转变为以服务为中心。电子商务等系统利用Web服务,实现了企业内及企业间的业务流程管理,并将业务
学位
随着多核平台和云计算技术的迅速发展,非一致性内存访问(NUMA)架构已经在云数据中心中占据支配地位。然而,虚拟化环境并不能很好地支持NUMA架构。由于虚拟化层引入的语义隔阂
随着西南医院信息化建设的全面发展,诊疗业务的不断拓展,以及不断递增的各类数据,建立新的中医管理体制和方法,成为中医科现代化建设的一个重要内容。为了合理利用中医科的现