【摘 要】
:
关联规则作为数据挖掘的一个热点方向,已经引起很多学者的广泛关注。本文在介绍权值和负关联规则的基础上,重点讨论了加权负关联规则的增量更新和剪枝算法。加权负关联规则的
论文部分内容阅读
关联规则作为数据挖掘的一个热点方向,已经引起很多学者的广泛关注。本文在介绍权值和负关联规则的基础上,重点讨论了加权负关联规则的增量更新和剪枝算法。加权负关联规则的增量更新,就是对已经发生变化的数据库进行新关系新规则的重新寻找,但并不是在发生变动后的数据库上运行原来的规则挖掘算法,而是既有效利用原有知识,又能及时发现新知识的过程。这是因为在大型数据库中,需要对数据库进行大量重复的扫描来挖掘新知识,而这样发现强规则的代价是很大的。而且这对关联规则在知识发现系统中的维护也提出了很高的要求。事实上,在规则维护问题中最复杂和最困难的就是新关系的发现。本文研究了一种加权条件下负关联规则的增量更新算法。通过实验证明该算法是高效可行的。另外,传统的关联规则挖掘算法apriori中所采用的剪枝方法是项集的向上闭包性质,即频繁项集的子集还是频繁项集,非频繁项集的超级一定是非频繁项集。但是加入权值以后,原来apriori算法中项集剪枝中的向上闭包性不在适用,即频繁项集的子集不一定还是频繁项集。本文提出了三次剪枝的加权负关联规则的挖掘算法。第一次剪枝在项集的挖掘时进行,第二次剪枝在规则的产生中进行,第三次剪枝在生成的规则中进行冗余剪枝。通过对实验结果的分析和比较,证明本文提出的算法可以使生成的规则数减少很多。
其他文献
无线传感器网络(Wireless Sensor Networks, WSNs)的出现引起了世界范围内的广泛关注,其应用已经由最初的军事国防领域迅速扩展到卫生医疗、环境科学以及我们的日常生活中。
改革开放以来,我国涂料工业发展呈日新月异的态势,其中中小型涂料企业占据了绝大部分。中小型涂料生产企业普遍存在面向订单生产的特点和综合成本较高、生产调度基本依靠人工
空对地视频交通监控以其直观、方便和价格低廉等特点,日益受到智能交通领域研究者的高度重视。其核心在于使用安装在无人机等浮空平台上的摄像机感知交通场景,通过关键技术的
随着经济的发展,顾客需求的多样化和个性化增加了企业在实际生产中的不确定性和动态性因素。为了满足顾客的需求,企业开始注重资源的合理配置。因此,研究多目标车间调度问题
无线传感器网络是21世纪备受关注的研究热点之一,已广泛应用于军事国防、医疗护理、城市管理、地震监测、设备监测、建筑物结构监测等明显带有实时性需求的领域。本课题来源
随着我国经济、工业的不断发展,资源的利用也在逐步增加,随之而来的就是资源污染、短缺的问题,其中最为显著的就是水资源。我国人口众多,在水资源占有方面远低于其他国家,人
随着计算机信息处理技术和通信技术的快速发展,每天都会产生大量的数据,对于一些资源有限的设备,如何在处理这些大量信息的同时保障其安全性是一个至关重要的问题。一种可行
针对当前词语相似度计算方法存在的局限性:基于语义词典的词语相似度计算方法依赖字典进行相似度计算,因此无法对字典未登录词语进行计算;基于语料库的词语相似度计算方法在计算
RFID系统有许多种类的安全与隐私保护方式,其中采用安全认证协议是性价比最优的,所以运用最广。这些安全认证协议大多是突出了两个主要途径:一种是哈希锁方案,需要随机数发生
随着互联网技术的快速发展,搜索引擎已成为许多人生活和工作中的重要工具。但是,由于网络信息的快速增长和用户搜索要求的不断提高,通用搜索引擎已经不能满足用户对于信息检