滑动窗口中数据流频繁项集挖掘算法研究

来源 :天津工业大学 | 被引量 : 0次 | 上传用户:1liuxiewei2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信息技术的高速发展,变化多样的数据形式使得传统的静态数据挖掘技术已无法适应高速流动的动态的数据挖掘,数据挖掘的发展方向更加深入。数据流就是其中最新出现的很重要的数据形式,在计算机网络、传感器、金融市场、股票交易以及医疗卫生等众多领域得到了广泛的应用,因此数据流挖掘技术成为了当前研究问题的热点。作为关联规则的基础和核心,数据流频繁项集的挖掘更是成为了数据流挖掘领域的一个热点问题。  数据流最大频繁项集的项集数目相对很少并且已隐含所有的频繁项集,所以数据流中最大频繁项集的挖掘具有很好的时空效率并且有很大的意义,也受到了业界更多的关注。针对数据流最大频繁项集的挖掘,提出了在滑动窗口中基于矩阵的数据流最大频繁项集挖掘方法SWM-MFI,主要采用两个矩阵来存储数据信息:一个矩阵是事务矩阵,存储事务数据;一个矩阵是二项集矩阵,存放频繁2-项集。通过二项集矩阵扩展得到频繁k-项集,基于SWM-MFI算法挖掘出最大频繁项集。经过理论和实验证明该算法具有很好的时效性。  有些传统的数据流频繁闭项集挖掘算法存在搜索空间大和查找效率低的问题,从而造成算法的时间效率较低。针对以上问题,提出了滑动窗口中数据流频繁闭项集挖掘算法DS-MCFI,首先引入两个矩阵:一个矩阵是事务矩阵,存储事务数据;一个矩阵是二项集矩阵,存放频繁2-项集;然后通过二项集矩阵扩展得到频繁k-项集,并通过逻辑与操作得到频繁k-项集的支持度,两个矩阵的相关操作可以明显降低算法的时间复杂度;再将支持度相等的频繁项集存储到数据字典结构中来提高算法的查找效率;最后通过挖掘所有支持度相等的频繁项集中的最大频繁项集组合生成频繁闭项集。经过理论分析和实验证明,DS-MCFI算法具有很好的时空效率。
其他文献
三维地形的可视化是地理信息系统(GIS)、数字摄影测量(DP)和遥感系统(RS)的重要研究内容,其中高度真实感三维图形的绘制是计算机图形学(CG)的重要研究内容。 三维地形显示
软件测试在软件开发过程中是一个非常重要方面,它并不仅仅限于在得到了开发完成的代码后,对代码进行功能性测试。软件测试技术的不断发展,已经让它渗入到软件生命周期的方方
针对目前工作流管理系统中普遍存在的柔性、鲁棒性及互操作性比较差的问题,论文结合实际开发工作流方面的经验,提出了一个具有柔性、互操作性的多引擎分布式工作流系统。该系
本文构建了一个基于J2EE的轻量级工作流管理系统MiniFlow.论文分别从工作流管理系统的体系结构、开发方案和工作流模型三个方面论述了MiniFlow对传统工作流管理系统的改进.Mi
本文分析了静态口令身份认证的优缺点,口令身份认证有2个重大的缺陷:口令可以被网络上的非法用户窃听,无法防止回放攻击。提出了一种通用的身份认证方案,并根据这种方案设计并实
计算机技术发展的历史已经有很多年了;随着时间的流逝,出现了越来越多的过时系统。尤其是大型企业,他们一方面要面临开发一个全新系统以替代旧有的信息系统,另一方面他们不得不考
面向对象方法是当今最流行的程序设计和开发方法,而关系数据库则是应用最广的数据持久化方法,这就势必要将面向对象程序中需要持久化的对象存储在关系数据库中。由于关系模式和
随着电子计算机科学、图像处理、计算机视觉技术与理论的迅速发展,立体视觉的研究与应用日益得到重视,并不断地在许多领域得到骄人的成果。本文以投影仪一数码相机系统为工具,重
资源描述框架(Resource Description Framework,RDF)是W3C组织提出的描述万维网上资源的通用模型,该模型已广泛应用于诸多领域,如语义网络中的资源描述、元数据描述、搜索引擎语
随着电厂分散控制系统(Distributed Control System-DCS)日趋大型化、复杂化的发展趋势,电厂对DCS系统仿真与培训的要求越来越高。本文在对DCS体系结构、DCS组态软件、DCS仿