蚁群算法在关联规则学习中的研究与应用

来源 :北京工业大学 | 被引量 : 9次 | 上传用户:c224224224
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多,激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。数据挖掘技术就是人们长期对数据库技术进行研究和开发的结果,它致力于数据分析和理解,用于揭示数据内部蕴涵知识,目前已成为现代信息技术应用的主要手段之一。关联规则挖掘旨在发现数据集中数据之间未知的、隐藏的、有趣的内在联系,它是数据挖掘中一个重要的研究方向,有广泛的应用前景,然而目前对关联规则算法的研究多注重于挖掘效率的提高,而忽视了对规则质量的要求。蚁群算法是一种模拟蚂蚁群体觅食行为的智能计算方法,它采用正反馈自催化机制,具有鲁棒性、计算分布性、易与其他方法相结合等突出优点,已在复杂组合优化问题求解等多方面展现出优异的性能和巨大的应用潜力.将蚁群算法应用于数据挖掘中是较新的研究方向,目前已经有学者将其应用到分类决策,聚类分析及规则发现的研究中。本文在系统地分析蚁群算法和关联规则的基础上,提出了一种用蚁群算法挖掘关联规则的新方法。改进后的算法将蚁群算法与关联规则的经典算法Apriori相结合,用蚁群算法在频繁项上挖掘关联规则。首先利用频繁项集构造一个完全图,这个完全图的顶点是频繁集中全部的频繁子集,边上的权值是任意两个频繁项集之间的支持度;然后将此完全图看作是蚁群算法求解的问题空间,算法中除了以边上的权值作为蚂蚁选路的启发因素之外,为了得到那些与具有较高的支持度的频繁项集相关的规则,在蚂蚁选路的过程中引入此完全图的顶点上的频繁项的支持度作为启发因素的一部分增加支持度对信息素的影响。在算法经过一定次数的迭代后,图中各边上的信息素的多少表示了频繁项之间的依赖程度,它是蚁群算法产生规则的表现方式;最后根据边上的信息素提取频繁项作为规则的前件和后件,经过规则的减枝后生成需要的规则。本文以美国棒球大联盟1974-2006年所有正式比赛的官方技术统计数据为实验数据,对文中给出的算法进行了实验验证,结果表明算法最后得出的结论反映了客观事实。
其他文献
近些年随着农业信息化的不断推进,越来越多的信息技术被引入到农业生产中去。如何实现水稻高产、稳产的目标,成为现代农业研究方向的一个重要课题。近几年物联网技术得到快速
在嵌入式系统飞速发展的今天,各种嵌入式系统正广泛应用于生产和生活的各个领域。面对嵌入式系统功能的复杂化,对性能要求、功耗要求的不断提高,越来越多的嵌入式应用需要基于异
随着计算机技术的发展,社会信息化程度的不断提高,计算机水平成为考核个人能力的一个重要标志,计算机考试也已经深入到每一个行业。尤其在教育行业中,传统手工阅卷已经逐渐走向计
移动Ad Hoc网络是一种不需要基础设施的多跳无线网络,网络中的节点既具有无线终端的收发功能又具有为其它节点转发信息的功能。网络中所有节点地位平等、功能相同,没有中心控
嵌入式系统的应用越来越广泛,随着嵌入式系统与网络的日益结合,在嵌入式实时操作系统中引入TCP/IP协议栈,以支持嵌入式设备接入网络,成为嵌入式领域重要的研究方向。作为嵌入
当前,嵌入式系统已经成为人们生活中的一部分。可以在很多应用中找到它们,如家用电器、工业设备、医疗设备、通信设备以及汽车应用等。有些嵌入式系统位于远离其使用者或操作者
聚类和分类是当前计算机人工智能领域的研究热点之一。人们渴望快速而准确地获取并处理信息,可是互联网上数据不但数量庞大,而且结构各异。信息自动聚类和分类技术,成为充分
信息技术和网络的迅速发展,各个应用领域之间的合作越来越频繁,数据的互操作性越来越重要。由于各领域生产方式的高度自治,导致了数据模式的异构性,为实现数据共享和使用,解
海冰是高纬度海域最为突出的海洋灾害之一。与常规遥感技术相比,高光谱监测海冰最大的特点就是光谱分辨率高,蕴含接近连续的光谱信息和丰富的空间信息,可以更加精确地区分海水和不同类型的海冰。高光谱海冰图像一般使用监督分类提高分类精度,典型的方法是基于支持向量机进行分类。对于高光谱海冰遥感图像,受条件限制,实测资料非常稀少,对样本进行标注需要耗费大量的时间和成本。但是如果只使用少量的标签样本训练海冰分类器模
智能优化算法作为新兴的搜索算法,一般是指利用自然界的生物系统与优化过程的某些相似性而逐步发展起来的优化算法,如遗传算法、粒子群算法、蚁群算法等,它们通过对搜索空间