基于FP-tree最小无冗余关联规则挖掘

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:junpenge
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前关联规则挖掘存在两个问题,第一是挖掘频繁项集效率低,第二是生成规则的数量和质量问题。针对这些问题,对基于FP-tree最小无冗余关联规则挖掘方法进行了研究,主要研究工作有:分析了最小无冗余关联规则挖掘经典方法AClose算法,针对AClose算法挖掘效率低下问题,采用基于FP-tree进行最小无冗余关联规则挖掘。为了基于FP-tree生成最小无冗余关联规则,给出了频繁最小项集的概念,并给出了在FP-tree上挖掘最小项集的理论。通过这些理论,给出了基于FP-tree同时挖掘频繁闭项集和频繁最小项集的MFF算法。为了提高基于FP-tree生成最小无冗余关联规则的效率,建立了基于FP-tree的结果树来存储频繁闭项集和频繁最小项集,并给出了从结果树生成最小无冗余关联规则的算法。算法实现中主要用到了四个优化策略来提高对节点的搜索效率:改进传统的FP-tree节点结构,将多叉树搜索转变为二叉树搜索,在结果树的节点结构中引入了频繁最小项集域,对FP-tree和结果树建立哈希索引。通过理论分析和实验证明了算法的可行性,实验证明了MFF算法在性能上优于AClose算法。最后对基于FP-tree挖掘最小无冗余关联规则存在的不足之处阐述了进一步的工作。
其他文献
以嵌入式微处理器和嵌入式操作系统为核心的嵌入式技术,已在很多领域得到了广泛的应用。由于互联网的应用日益普及,信息共享的程度不断提高,传统的串行通讯和并行通讯方式的
移动计算设备实施远程教学即M_Learning,M_Learning模式的远程教育则给用户提供真正的随时随地、个性化学习、开放式学习。移动学习是一个完整的教学体系,它从组织内容方面包
近年来,随着计算机技术的迅速发展,嵌入式系统开发已经成为信息产业的热点。在嵌入式的开发过程中,友好的多媒体人机界面为嵌入式产品的开发提出了新的挑战。由于民族、文化
多机器人合作追捕目标问题研究的是多个自主型移动机器人组成的追捕团队相互合作去捕捉另一群移动机器人。在追捕-逃跑过程中,机器人追捕团队需要相互协调与合作才能完成追捕
串匹配是计算机科学中一个基本、重要的研究问题。多目标和多模式匹配是串匹配技术的重要研究内容。多目标和多模式精确串匹配技术要求目标串(正文串)与查询串(模式串)完全一
近年来,航天遥感技术等得到了飞速发展。如何有效地处理遥感图像,从中快速、准确地提取所需要的信息,是当前遥感领域十分热门的研究热点。在处理遥感图像的过程中,对线性地物尤其是对道路的提取占有十分基础和重要的位置。本文介绍了图像处理的相关理论,在分析和借鉴部分现有的道路提取算法的基础上,尝试利用计算机模拟人类对图像的识别习惯来进行地物识别,进而提取出道路。论文对于高分辨率彩色遥感光学图像,提出了一种基于
虚拟各种自然现象是计算机图形学的一个重要探索领域,特别是对不规则物体的模拟十分困难。在科技高速发展的今天,随着计算机性能的提高,从而使计算机对世界的模拟达到了新的境界
T-S模糊系统具有线性规则后件的特点,被广泛应用于基于数据建模的应用中。模糊系统辨识是模糊系统建模的主要手段,优化模糊系统结构是模糊系统辨识的关键。在模糊系统辨识的
图像分割是模式识别和图像处理的重要组成部分,针对具体的图像有不同的分割方法,其中基于图论的图像谱方法分割是近年来国际上图像分割领域的一个新的研究热点。尽管谱聚类算法
程序设计语言考试中的自动化试卷评分技术因其涉及多方面的理论知识已经成为一项非常有意义的研究课题,但目前该领域,实用性好而且功能健全的系统很少。在基于程序理解和语义