数据挖掘中关联分析算法研究

被引量 : 0次 | 上传用户:lichong0324
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘在商业中的广泛应用使得它成为数据挖掘中最活跃的研究方向之一。强相关项目对的挖掘算法是提高数据挖掘效率的有效方法,是解决当前关系数据库挖掘问题的关键途径之一。在传统的基于支持度的关联规则挖掘框架中,数据之间真正的关联可能未被发现,与此同时可能还会产生太多不具有真正相关性的规则。统计关联被越来越多的研究人员所采用,以弥补关联规则的不足。关联分析算法的研究对于提高数据发现、搜索效率,推广数据库在社会各领域的应用等方面具有十分重大的理论价值和实际意义。本文紧密结合课题背景需求,对强关联规则和关联模式的挖掘问题进行了全面系统地探索。主要研究内容组织如下:首先,为了在关系数据库上进一步减少候选项目对测试的代价,通过第一范式的性质,对Taper算法进行改进,提出了改进的TaperR算法,在挖掘过程中减少候选项目对的数目,从而提高算法的效率。实验结果表明,设计的新算法在进行关系数据库上的强相关项目对挖掘时,具有良好的效果。因此,更适合在实际的关系数据库系统中应用。其次,设计了一种高效的通过单次扫描数据库获取Top-K项目对的挖掘算法,且不产生任何候选集。查找基于支持度的top-k强关联项目对的问题本质上是计算1-和2-成员项集的问题,利用支持频度获得top-k强关联项目对。新方法利用相关图矩阵存储所有1-和2-成员项集的支持频度。然后,利用相关图矩阵计算所有项目对的相关系数φ,最后提取k个最相关的项目对,实验表明方法行之有效。第三,为了有效解决关系数据库上的Top-K强相关项目对的挖掘问题,提出了基于阈值估计的Top-K强相关项目对挖掘算法,即利用数据库的结构信息和比较算法,寻求K个具有最大皮尔森关联系数的项目对,实验结果表明,新方法是行之有效的。第四,基于用户偏好模型提出了一种智能的最小支持度设定系统架构,在用户偏好模型中为指定用户找出了最相似的查询,将它们联合起来获得适当的支持度范围以供用户参考。基于本方法,用于Apriori算法的支持度阈值设定不再全是主观的,而是包括了来自其它用户经验的额外知识。这就提高了用户查询构造过程的效率,获得的规则或挖掘也趋近于用户的要求。此外,为了解决在结构化数据库中查找频繁关联模式对的数据挖掘问题,开发了具有强大剪枝能力的算法。还讨论了新算法对于在一维和多维结构化数据库中发现模式对适用性问题,并评估了新算法的效率。最后,提出了领域知识驱动的图像关联模式挖掘算法。图像中包含了很多具有诊断意义的关键像素区域(ROI),这些ROI具有自身的属性,ROI之间还存在空间关系,而图像自身还包含属性和描述,这些特点都是传统的关系数据不具有的。在领域知识的指导下,在图像预处理时提取了图像关键像素区域的特征,并对根据这些特征聚类后的类项集进行挖掘关联规则,提出了EXFP-GROWTH算法,该算法过滤掉了对挖掘没有意义的项,从而能够快速地挖掘出与任务相关的关联规则。最后给出了实例结果分析并总结了研究意义。
其他文献
在当代语文教育发展中,传统文化教育越来越得到重视,“恢复传统,传承文化”的呼声越发高涨。与此同时,随着中国在国际社会地位的不断提高,国际间的经济文化交流的日益加强,越
裸露山体造成水土流失,生态退化.探讨了厦门岛外裸露山体植物治理技术,提出了裸露山体植物治理基本思路和主要技术措施.
中国北方草地横跨干旱、半干旱及亚湿润干旱气候区,水分是限制中国北方草地植物群落生产力的主要气候因子.采用基于水分平衡过程的、简单的植物群落模型,利用460个气象站40年
随着交通的发展,各种新型桥梁逐渐进入人们的视野,其剪力滞效应也日益受到国内外专家学者的关注。波形钢腹板组合箱梁桥就是其中的一种新型桥梁,它用波形钢腹板取代了传统箱
世界经济危机,我国经济社会发展的失衡凸显。持续的外向型和粗放型发展模式已经不能持久,我国迎来经济社会结构调整的关键期,需要应对发展过程中新的抉择和痛苦的转型。一方
介绍了研制锻造半高速钢冷轧辊的工艺特点和性能。通过化学成分的设计,冶炼,锻造,热处理,机械加工等工艺,使锻造半高速钢冷轧辊的实物质量达到了设计要求,于2001年12月在宝钢1420机
采用传统工艺制备出B2O3引入量分别为0,5.6,11.2,16.8g的SiO2-Al2O3-BaO-CaO-B2O3固体氧化物燃料电池(SOFC)封接玻璃,并通过傅里叶红外光谱仪(FTIR)、高温显微镜(HSM)、X射线
合肥市园林绿地中使用的落叶阔叶乔木树种悬铃木、国槐、无患子、黄山栾树不仅使用范围广、用量大,且历史也比较悠久。随着合肥市绿化大建设的步伐,它们在城市绿化中作用越来
铅芯橡胶支座在蠕变荷载作用下水平抗力很小,而在地震强烈动荷载作用下屈服后刚度迅速降低,同时支座滞回耗散地震能量;液体粘滞阻尼器是速度相关型耗能装置,提供构件强大的恢