基于关联规则的增量挖掘算法的研究与设计

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:helloliuhh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在关联规则挖掘问题的研究上,除了在用户给定明确的最小支持度和最小置信度后需要有快速高效的挖掘算法外,提出新的算法以解决如何在用户无法预先明确知道能够获得满意结果的最小支持度的情况下也能够快速有效地进行挖掘处理,是一个更加实用化的研究课题。另外,基于数据库时时在被更新这样的现实,除了需要相同最小支持度的条件下的有效更新算法外,允许调整最小支持度的有效更新算法也是非常重要的研究课题。 简单介绍了数据挖掘的基本定义、常用技术以及其相关知识,综述了数据挖掘的发展和现状,指出了增量数据挖掘的重要意义。 分析了挖掘关联规则的经典算法Apriori以及常用的几种改进算法,指出了他们的共同特点:以逐层搜索的迭代方法来挖掘频繁项集,以及存在的固有缺陷,并给出了每一种缺陷的改进方法。 对目前的增量数据挖掘算法进行了分类,对每一种分类详细的介绍了各自对应的算法,指出其都不能解决最小支持度和最小置信度发生变化的同时数据库也发生变化的增量更新问题。 对于关联规则的更新问题一种最直接的方法是重新运行一遍Apriori算法,但是由于没有充分利用以前的挖掘结果,增加很多不必要的运算时间。在分析总结原有算法的基础上,针对现行增量挖掘算法的困难和不足,提出了HIUA(Hash Incremental Update Algorithm)算法,该算法充分利用以前挖掘的结果,将链表插入、删除以及hash定位高效率的特性结合起来,摆脱了传统算法多次迭代的不足,只需扫描一次数据库,就能满足各种要求,通过以空间换取时间,大大提高了挖掘效率。同时将挖掘出来的结果有效地保存,以便下次增量挖掘时充分利用。 实现了HIUA算法,通过对其测试结果与Apriori算法的测试结果进行比较,进一步证明了该算法的高效性。
其他文献
随着互联网技术的发展,一方面,对等网络的提出彻底颠覆了传统的客户机/服务器模式,为网络上新的应用提供了一个更新颖的拓扑结构;另一方面,“网格”概念的提出为互联网上的服务提
随着入侵事件的日益猖獗,人们发现只从防御的角度构造安全系统是不够的。入侵检测技术是继“防火墙”、“数据加密”等传统安全保护措施后新一代的安全保障技术,它对计算机和网
高性能计算系统现在越来越多采用将许多计算节点高速互连的集群形式实现,随着集群系统的规模不断扩大,其发生故障的次数也以指数增加,系统的容错性和自我修复能力正变得极其
车辆牌照识别系统目前得到了广泛的应用,对交通智能管理具有重要的意义。而车牌字符识别作为其中关键的环节也成为了目前的研究热点,它综合了图像处理,模式识别以及机器学习
三维重构是目前图像处理领域的研究热点,属于多学科交叉的研究课题,涉及到计算机图形学,图像处理等多种技术,在制造业、虚拟现实、建筑、医学、文物保护、电影特技制作等领域
随着因特网实时性业务应用的高速增长,IP网络的QoS(QualityofService,服务质量)路由问题已成为当今网络通信领域的一个研究热点。流量工程作为实现网络负载均衡,优化网络性能的
随着互联网技术的快速发展,隐私保护已逐渐成为数据发布领域中备受关注的问题。数据匿名化技术是实现隐私保护的主要途径,其中,K-匿名模型是最有效、最为常用的一种经典匿名
针对钻井物料需求规划和控制在石油上游企业的重要意义,结合国内外研究现状,将MRP的科学物料管理思想引用到钻井行业。通过物料的需求规划和库存控制两条主线提出基于MRP思想的
公开密钥基础设施(Public Key Infrastructure,简称PKI)是网络安全建设的基础与核心。从理论上说,它采用证书管理公钥,把用户的公钥和其它信息捆绑在一起来认证用户,它是有效进行
随着经济的发展高压电机在各行各业应用的越来越多,电机起动也成为一个迫在眉睫需解决的问题。本文简要的介绍了现今高压交流异步电动机几种起动方法。分析了各种起动方法的优缺点,指出磁控软起动在综合性能指标及成本方面优于其它的软起动方式,根据电机的Γ型等效电路,分析了高压磁饱和电抗器起动原理,及磁饱和电抗器工作原理,在此基础上研究开发了高压电动机起动用磁饱和电抗器控制装置。利用单片机的计算能力及一些外围器件