基于多支持度的正负关联规则挖掘技术的研究

来源 :山东轻工业学院 齐鲁工业大学 | 被引量 : 0次 | 上传用户:passkakaxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则的研究是数据挖掘的重要内容之一,现有的关联规则挖掘算法大都是在频繁项集的基础上进行挖掘,关于非频繁项集的研究较少,然而在研究负关联规则后,非频繁项集因包含重要的负关联规则而变得非常重要。同时,现有的关联规则挖掘算法大多是在单一最小支持度的限定条件下进行的,而事实上由于不同数据属性的发生频率不同,仅依靠单一的最小支持度限定就可能无法正确反映挖掘对象本身的特征。为了弥补单一最小支持度的不足,进而出现了多最小支持度算法。本文在多最小支持度算法的基础上,对多支持度算法进行了改进和完善,提出了3种新的算法:MMS-inFS算法、2LMS-inFS-FS算法和MLMS算法。MMS-inFS算法是在多支持度算法的基础上增加了一种对非频繁项集的约束机制,使其能够同时挖掘频繁项集和非频繁项集。2LMS-inFS-FS算法是基于两级多支持度的挖掘算法,是将MMS-inFS算法中的对非频繁项集的约束由单一的支持度更改为多支持度,即对每个项集设定了两级支持度,一级支持度用于约束频繁项集,另一级用于约束非频繁项集,这样能够更好的限定频繁项集和非频繁项集。MLMS算法是一种基于多层最小支持度的算法,即对不同长度的项集采用不同的最小支持度。对于新提出的算法模型,我们与其它几种模型进行了比较,并且通过实验表明这些算法是非常有效的。
其他文献
随着Web技术的发展,越来越多的企业应用被开发出来,但是目前存在的很多企业应用由于市场效应、技术等原因缺乏合理的系统架构支持和有效的维护文档,给系统的维护和升级带来了很
随着计算机网络的不断发展和Internet的广泛应用,人们可以共享世界范围内的资源和信息。为方便共享和管理纷繁复杂的网络资源和信息,目录服务技术应运而生。轻量级目录访问协
随着计算机研究领域突飞猛进的发展,由此产生的科技文献呈爆炸性增长。面对浩如烟海的资源,用户目前无法直接查询出他所关心的研究领域发展历程及当前该领域的研究热点。而依
面向服务的体系结构(SOA)作为一种新的软件架构方法,已成为企业实施信息化集成的首选解决方案。但SOA所具有的动态性、开放性特点,使其面临的安全问题更加突出。服务请求者和
随着视频监控技术的发展,嵌入式视频监控系统以其直观、方便和内容丰富等特点,日益受到人们的重视和关注,被广泛应用于众多场合。武汉精伦电子股份公司的四路网络视频监控服
网络等信息技术的迅速发展和广泛应用产生了大量的数据流,如:超市交易记录、网络搜索请求、电信通话记录等。这些数据流中隐含着丰富的有价值的知识亟待挖掘。分类算法研究作
随机局部搜索算法是一种解决计算机科学和运筹学领域中组合最优化问题的元启发式方法。近年来,由于其简单、高效的特点而得到越来越多的应用。本论文中,我们对随机局部搜索算
Web服务将程序封装成单个实体并发布到网络上以供其他程序使用的功能,可以使企业和个人迅速且廉价地向网络用户提供服务。Web服务具有十分广阔的市场前景。随着Web应用的迅速
从事务数据库中挖掘有意义的项集已经被研究超过10年。频繁项集挖掘主要挖掘出那些在事务数据库中大量出现的项集,这些项集之间存在很强的联系,可以为决策者提供有效信息,从
随着数据业务的不断发展,下一代网络成为发展的必然趋势。下一代网络采用分层的结构,分为松散耦合的业务层、控制层、媒体传输层和接入层。在下一代网络的发展中,SIP(Session