基于关联规则的数据挖掘算法研究

被引量 : 5次 | 上传用户:bushishuai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
进入21世纪后,全球已经进入了信息化时代。随着信息化程度的不断提高,世界各地的企业或其他机构都储存了大量的数据。如何从如此海量的数据中获得有用的信息并加以学习利用,已经成为信息技术发展与应用的重要课题。“数据挖掘”的提出为这一课题提供了解决的可能性。关联规则挖掘作为数据挖掘的一个重要研究分支,其主要研究目的就是从大型数据集中发现隐藏的、有趣的、属性间的规律,发现满足用户定义的最小支持度和最小可信度的关联规则。本文首先介绍了数据挖掘的相关理论;其次介绍了关联规则挖掘的相关理论和关联规则经典的挖掘算法——Apriori算法和FP-growth算法,前者会产生大量的候选集,降低了挖掘效率,后者会占用较大的内存空间,当数据库大到不容易装进内存时,算法性能下降得也很快;再次介绍了Zaki提出的一种高效的关联规则挖掘算法——Eclat算法,针对该算法有重复操作,无剪枝步骤,并且产生的候选集也很大等不足,本文提出了Eclat算法的改进算法——Eclat_N算法,通过给出两种算法的挖掘比较,可以明显地看出Eclat_N算法优于Eclat算法;最后全面地介绍了含有项目约束的关联规则挖掘问题,并给出了以Eclat算法为原型的,基于约束的最大频繁项集的关联规则挖掘高效算法。该算法是将约束条件应用到挖掘算法中,削减了候选项目集的个数,使算法的运行效率得到明显提高。对算法进行了详细的分析。实验结果表明,该算法具有较好的可操作性,并在一定程度上解决了产生许多无关或无价值的关联规则。
其他文献
在"互联网+"大背景下,一些网络购物平台不断地涌现在大众面前,随着人们的生活水平日益提高,工作压力不断增大,因此,人们更加倾向于网上购物,人们都喜欢享受这种方便快捷、不
民主是党的生命。中共自成立之日起,就确立了“人民当家作主”的方向和目标,并为坚持民主执政进行了积极的不懈的探索与实践,取得了显著成就,从而开创了一条有中国特色的民主
随机思想成为人们生存的必需的基本素质之一。由于概率研究的对象是不确定现象,与传统的教学内容有着极大的不同,因此传统的教育观念和教学方式就显得有些苍白,如何搞好概率
2014年初在西非暴发的埃博拉病毒病疫情仍在蔓延。美国是急性传染病防控体系最为完善的国家,疾病预防控制中心、美国国立卫生研究院等机构通过发布系列专业技术指南、发布权
目的评价无抽搐电休克治疗与选择性5-羟色胺再摄取抑制剂治疗抑郁症的疗效及对记忆的影响。方法60例抑郁症患者随机分成两组,分别实施无抽搐电休克治疗(MECT)及选择性5-羟色
在全球金融危机的情况下,中国的实体经济和虚拟经济都受到了较大冲击。中国房地产业作为一个国内的支柱行业,同样面临着非常大的挑战,资金和土地成为制约我国房地产企业发展
为了探索青少年家长对上海市儿童参与状况的理解,本研究对1083名35-50岁的家长进行了问卷调查。结果表明:约一半的家长了解儿童参与权;儿童参与程度由高到低依次为家庭、学校和
<正>"百年企业"禄博纳高瞻远瞩,发力汽车市场,把握增长机遇。一方面,产品生产方式的灵活性给汽车内饰带来高附加值;另一方面,技术持续创新也为用户带来成本优势。汽车市场的
阐述了系统仿真、计算机仿真和交通仿真的基本概念 ,介绍了国外道路交通仿真研究的发展历程和趋势以及国内的研究现状 ,分析了道路交通仿真研究的意义 ,并提出了研究思路
本文对番茄红素的理化性质、生物学功能、制备、分析与检测和应用情况的进展进行了概述。