增量数据挖掘算法LIUA的设计及应用

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:addnh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数据挖掘技术的研究引起了国际人工智能和数据库等领域专家与学者的广泛关注。在事务数据库中挖掘关联规则是数据挖掘领域中的一个非常重要的研究课题。目前以Apriori算法为基础所推导出的各种数据挖掘技术,大多是针对静态的数据,从中挖掘出用户感兴趣的关联规则。这种方法虽然实现简单,但是它没有充分利用已经获得的发现结果,太浪费计算时间及硬件I/O,因此效率非常低下。 本文所提出的LIUA算法充分利用已经获得的发现结果,将已经挖掘过的数据科学地、妥善地处理及保存,使得新增数据时能重复利用,这样大大提高了时效,在商业运用上非常有价值。 1.研究了挖掘关联规则的经典算法Apriori以及常用的几种增量关联规则的挖掘算法FUP、IUA,分析了它们的执行效率,指出了其效率低下的主要原因是由于多次迭代扫描、每次迭代产生数目更大的频繁集造成的。 2.在分析总结了原有算法的基础上,提出了LIUA算法。该算法只扫描一次数据库,就能把符合要求的关联规则挖掘出来,摆脱了传统算法多次迭代的不足,采用以空间换取时间的技术,大大提高了挖掘效率。同时将挖掘出来的结果有效地保存,以便下次增量挖掘时充分利用,而且还可以减少传统挖掘算法“少挖”、“漏挖”的现象。 3.实现了LIUA算法。通过对其测试结果与Apriori算法的测试结果进行比较,进一步证明了该算法的高效性以及挖掘的充分性。 文中描述了LIUA算法处理AVIM系统收集的数据的过程,对挖掘出的关联规则进行了分析,并用来指导人们的生活,指出LIUA算法在AVIM系统应用中的现实意义。
其他文献
随着计算机网络和通信规模的不断扩大,网络结构日益复杂和异构化,对网络管理技术的要求越来越高。  本文对JMX的网络管理系统的设计和实现进行了研究。文章以一个把传统的网
在基于构件的软件复用中,构件库系统扮演着极为重要的角色。构件库系统有效地组织和管理大量可复用构件,并提供相应的工具支持开发者在软件开发过程中方便地查询、理解和选取
本文分析、研究了Linux的实时性、进程调度策略及内核的裁减和编译。首先对嵌入式Linux的组成、特点及其自身的优势做出阐述,并介绍了它在国内外的发展现状。然后重点分析了影
航班进场排序是空中交通流量管理的重要内容之一,由于存在各种不确定性的因素以及信息交互缺乏实时性,机场终端区容易出现拥挤现象。航班进场排序的主要目的是,在确保安全的
随着计算机网络的不断发展,全球信息化已成为人类发展的大趋势。但由于计算机网络具有联结形式多样性、终端分布不均匀性和网络的开放性、互连性等特征,致使网络易受黑客、怪
本文对基于流量密度分析的攻击源追踪技术进行了研究。文章介绍了拒绝服务攻击的一些背景和主要的攻击手段;重点讨论了已有的一些攻击源追踪技术,包括ICMP定位报文法、概率包标
网络与计算机越来越广泛的使用在现今社会,企业、政府和其他组织的工作也越来越依赖于计算机网络系统,因此安全问题也更加突出。入侵检测系统IDS(Intrusion Detecton System)
将图像处理技术应用到车辆驾驶辅助系统当中可以有效地为车辆安全行驶提供安全保障。利用图像处理技术对障碍物体进行识别是车辆驾驶辅助系统实现的主要功能。本课题采用图像
随着石油企业计算机技术运用的不断深入,传统的基于Intranet的钻井信息管理造成的平台和数据结构的异构性使得不同部门及合作的石油企业间的钻井信息难以交换和共享。数据集成
无线传感器网络经常会遭受各种安全威胁,例如节点暴露在不安全的物理环境中时容易被俘获;采用无线电传播信号时信号容易被截获等。因此无线传感器网络安全是无线传感器网络的