关联规则挖掘算法的研究

来源 :成都信息工程大学 | 被引量 : 0次 | 上传用户:szhzm4158
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘是数据挖掘众多研究领域中非常重要的研究方向之一,其应用领域涵盖了应用经济学、教育学、管理学、情报学和医学等等,具有很高的研究价值和实际意义。为了快速发现事务数据库中不同项目之间潜在且有趣的规则,本文主要研究了与关联规则挖掘算法相关的如下四部分内容:(1)串行频繁项集挖掘算法。本文在深入研究了Apriori算法和Eclat算法的基础上,提出了一种采用优化候选项集的改进Eclat算法,即IEclat算法。通过对比分析Apriori算法、Eclat算法和IEclat算法的仿真结果,证明了IEclat算法的准确性和有效性。(2)并行频繁项集挖掘算法。本文在重点研究了Hadoop平台及其重要组成部分的基础上,提出了一种以IEclat算法为核心算法,以MapReduce框架为计算模型的并行频繁项集挖掘算法,即MR_IEclat算法。通过对比分析MR_Eclat算法和MR_IEclat算法的仿真结果,证明了MR_IEclat算法的准确性、有效性和可扩展性。(3)兴趣度度量方法。本文通过分析传统的“支持度-置信度”模型存在的问题,引入了兴趣度,并提出了一种新的兴趣度度量方法,即“相关兴趣度”。通过与全置信度、确信度、提升度、优势比等四种典型的兴趣度度量方法作比较,总结了相关兴趣度的性质和优势。(4)关联规则挖掘模型。本文通过计算四种典型兴趣度和相关兴趣度的值来分析关联规则的有趣性,得出了使用单个兴趣度不能获得更有趣的关联规则的结论。通过结合传统模型和多种兴趣度度量方法,提出了“支持度-置信度-多兴趣度”的模型。通过对比分析传统模型和新模型的仿真结果,证明了使用新模型挖掘关联规则可以删除冗余的关联规则,并且挖掘出的关联规则比传统模型挖掘出的关联规则更有趣。
其他文献
【中图分类号】G633.2 【文献标识码】A 【文章编号】2095-3089(2018) 18-0064-01  以当前的教学现状分析来看,各个学科之间都独具一格,也就是每个学科都有各自的特点和优点。然而,我们要做的,就是要取长补短,保持优点,改进缺点。针对教学中存在的问题我们要对此持正视的态度,并且也要据此提出相应的问题解决的策略。  一、初中政治教学中存在的问题  1.教学观念过旧  教师的教
【摘要】新课程改革实施的过程中,要求教师必须在教学过程中,采取积极有效的策略,将学生学习的积极性和主动性充分调动起来,才能促进教学效率与质量的有效提升。由于小学阶段是学生良好信息技术意识与能力培养的重要阶段,所以,教师在教学过程中,必须采取多样化的教学方式,加强学生信息素养与信息技术能力的培养,为学生后期的成长与发展奠定良好的基础。文章主要是就小学信息技术的新思考进行了分析与探讨,希望可以为小学信
【摘要】本研究主要以访谈的形式,从语言熟练程度等方面探究了汉语国际教育专业本科生在为期四个月的出国交换学习对跨文化交际能力的影响。结果显示,短期出国留学对汉语国际教育本科生目的语的习得十分有益,对提高跨文化交际能力也有着积极的影响。  【关键词】出国交换 汉语国际教育本科生 跨文化交际能力  【基金项目】本文系2017年新疆大学大学生创新训练计划项目“出国交换对汉语国际教育专业本科生跨文化交际能力
对于计算机网络的研究,传统的算法都是在网络完好情况下进行网络规划,而没有考虑网络故障的情况。该文采用混合遗传算法形成满足连通度和跳数约束的初始网络,分析了网络故障下的
设计一种基于视频技术的嵌入式车辆检测系统。该系统采用DSP+FPGA硬件结构,通过FPGA进行图像采集控制,DSP进行图像处理,实现对运动车辆的检测。程序设计采用选择性背景更新法提取
目的研究艾滋病病毒职业暴露的原因、过程、危害、处理等,以此来探讨暴露后的预防及其恰当的处理方式。方法对我院出现职业暴露的工作人员的资料进行整理分析,再给予合理的历
藏毛窦(Pilonidal Sinu S,Ps)是常发生于骶尾部及臀间裂上部,表现为骶尾部脓肿或反复破溃后形成含有毛发的窦道,内藏毛发是其特征。是临床上的一种少见疾病。随着我国生活水
卡梅隆签名是一种非交互式的数字签名,其使用的Hash函数是一种特殊的陷门单向Hash函数——卡梅隆Hash。卡梅隆数字签名具有不可传递性和不可否认性等优点。该文利用基于身份和