【摘 要】
:
当前,数据挖掘是数据库研究、开发和应用最活跃的分支之一,引起了学术界和产业界的广泛关注.而其中关联规则挖掘在商业等领域的成功应用,使其成为数据挖掘中最成熟、最重要、
论文部分内容阅读
当前,数据挖掘是数据库研究、开发和应用最活跃的分支之一,引起了学术界和产业界的广泛关注.而其中关联规则挖掘在商业等领域的成功应用,使其成为数据挖掘中最成熟、最重要、最活跃的研究内容.而频繁模式的挖掘是关联规则挖掘的基本步骤.该文在分析了在频繁模式挖掘领域经典的Apriori算法、FP-growth算法与基于互关联后继树的IRST算法的基础上,针对频繁模式挖掘的特点对互关联后继树模型进行了一定的改进,提出了间接互关联后继树簇模型(IIRSTC),并提出了基于IIRSTC的频繁模式挖掘算法.通过和FP-growth算法及原有IRST算法进行全方位的比较,可以发现间接互关联后继树簇模型在频繁项集挖掘任务中在保留了原有IRST算法的优点的同时,又在效率上比原有IRST算法取得了很大的进步,与FP-growth算法相当.IIRSTC算法和前两者一样都采用无需产生候选项集,直接构造频繁项集的方法,并都充分利用Apriori性质来提高挖掘效率.它有其独特的优点:只需要扫描一遍事务库;频繁项的挖掘只局部关联于一棵根树,内存需求小;算法简单容易理解;对IIRSTC的更新操作简单易行.同时IIRSTC模型也是一种索引事务库的通用模型,具有高效支持事务查询的能力.
其他文献
在交互式系统中一个重要的环节就是人与计算机之间的交互。交互方式是否自然真实、计算机响应是否准确、计算机响应是否实时等等因素决定了人与计算机之间交互的成功与否。人
自然语言理解,特别是中文信息处理,一直是计算机界的难题。让计算机来理解和处理丰富的自然语言,极具挑战性。自然语言的计算机处理是一个多学科交叉研究领域。来自计算机科
作为"济南市环境空气质量及空气污染源监控、预警技术及监控网络的研究开发"项目的研究报告,本文详细描述了系统中实时监测和控制的实现方法和技术;描述了利用高斯点源扩散模
随着经济的发展,汽车运输量大幅度提高,在路车辆也越来越多,从而使传统的人工收费和半自动收费方式,越来越难以满足收费公路运营和管理的要求,在收费出入口处经常因收费效率
本文主要是针对分布式数据库系统中的数据一致性问题.所谓分布式数据库是指数据库中数据在物理上分布但是在逻辑上是一个整体的数据库系统,为了获得更高的可用性,可靠性和安
近年来,对主体的研究蓬勃兴起,面向主体的编程被誉为是继面向对象编程之后的“软件开发的又一重大突破”。随着对主体理论与技术的深入研究,多主体系统已成为当前的研究热点。在
本文首先综述了当前工作流模型及其验证方法,着重介绍了基于Petri网进行工作流建模和验证的优缺点,然后提出了一个基于双分支条件有向图(Double-Road Conditional Directed G
超分辨率图像重构技术的目的是从几幅包含有相同区域的图像序列中重新构建更高分辨率图像,采用这种重构算法不仅利用了图像内象素间的空间相关性,而且利用了图像间的时间相关
本文提出一种基于CORBA(Common Object Request Broker Agent)的分布式入侵防御系统(DIPS,Distributed Intrusion Protection System),较之传统的入侵监测系统,具有实时、易
随着网络和多媒体技术的发展,视频信息的检索成为非常重要的研究领域.该领域涉及诸多方面的技术,包括对关键帧的提取,视频在时间序列上的分割,视频片断的相似度度量以及高维