基于负频繁项集的负关联规则挖掘研究

来源 :山东轻工业学院 齐鲁工业大学 | 被引量 : 0次 | 上传用户:woshizzh1713
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着微型机以及网络的普及和数据存储技术的发展,很多领域的数据库中都可储备了海量数据,通过利用数据挖掘工具来分析和进一步理解储备的数据,发现数据中后面的有用知识成为目前计算机领域中最为活跃的一个研究领域。显然,位列其中的关联规则挖掘是一个重要分支,具有相当重要的价值和十分广泛的领域应用前景。关联规则有正、负关联规则。目前而言,正关联规则研究已经受到了研究人员相当的关注,而对含负项的负规则的研究力度仍然不够。然而,在相当多研究领域中,事物否定因素也可以用来作为重要信息来源有着相当重要的作用,因此为了达到更客观决策的目的,我们完全有必要对负属性的关联进行研究。本文基于正关联规则和对负关联规则定义的修改,提出了关联模式表达式的左端或者右端或者左右端含有正、负混合项关联规则。现有负关联规则及算法数目不够多,而且大都基于Apriori思想的算法,需要对我们存储的数据集进行扫描多次,也会生成大量候选项集。本文提出了新方法,用来从正频繁项集中挖掘负频繁项集的算法,即e-NFIS算法。为了得到正频繁项集,我们借用FP_growth算法,利用这个算法中频繁模式树压缩存储数据结构,然后基于容斥原理的公式来计算挖掘出研究所需的含负项目的频繁项集。基于该算法的基本思想,算法具有了避免多次扫描数据库和生成大量候选项集的优点。在时间和空间的开销上跟目前的大多数据挖掘算法相比都具有一定的优势。实验证明,算法具有很好的效率。另外,论文对现有的研究含正、负混合项的负关联规则算法存在的问题,进行了探讨,在对目前算法分析的基础上。提出了如何将目前关联模式的一边或者两边含有正、负混合项负关联规则中出现的矛盾关联规则进行过滤,提出了正相关情况下有效选取关联规则的方法。论文另外对含负项的负关联规则的矛盾性进行了讨论。用例子证明,论文提出的改进方法是正确有效的。
其他文献
军事仿真技术作为一门实用性学科,凭借其独有的风险低、效果好、投入少、可重复等优点,已经受到普遍关注,得到广泛应用。为了辅助新型武器研制,评估决策效果,缩减军费开支,人们开发
学位
计算机网络尤其是Internet的发展奠定了新经济时代的信息基础。计算机网络已经改变了人们工作和生活的方式。在日益成熟的网络及通信技术的支持下,计算机网络迅速发展,网络规
数据挖掘是一门从大量的日常业务数据中提取隐含的同时又是有用的信息的新兴技术.数据挖掘算法对其处理的数据集合一般都有一定要求,比如数据完整性好、数据冗余性少、属性之
为了解决Web上信息增长给用户带来的一系列问题,Tim Berners-Lee提出了语义Web的概念。在语义Web中,信息被赋予定义完好的语义,能够被计算机理解和处理。本体(Ontology)是领
随着计算机视觉技术的发展,人脸检测和跟踪技术获得了广泛的重视,并成功应用于自动人脸识别、智能人机交互、视频会议等领域。与此同时,随着机器人技术的发展,人与机器人之间
近几年,数据挖掘领域涌现出一种的新研究课题—数据流挖掘。在许多实际应用中,如股票分析、网络故障监测、信用卡欺诈领域得到了广泛的应用。数据挖掘研究领域里分类挖掘是其
随着经济的发展,城市的交通情况越来越复杂。交通仿真技术是计算机仿真技术在交通工程领域的应用,VISSIM交通仿真软件是评价交通控制方案设计的优劣和交通规划设计合理性的重
学位
近年来,计算机技术和网络技术得到了充分的发展,随之而来的是多媒体信息被人们广泛地应用到社会的各个领域。正因为如此,多媒体通信中的安全问题日益成为了人们的焦点,而密码
当前社会经济发展迅速,越来越多的人选择将旅游作为假期的活动。而旅游业又是一个对信息依赖程度很高的产业,为了满足用户对信息需求的多样化,很多研究者将目光聚焦在如何建
C2是一种基于构件和消息的体系结构风格,支持大粒度的软件复用和灵活的系统组装,具有良好的应用前景。本文在深入研究C2风格的基础上,将C2风格与目前普遍采用的三层B/S体系结