智能算法在关联规则挖掘上的应用研究

来源 :河北工程大学 | 被引量 : 5次 | 上传用户:gaogaozai11111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘主要是研究数据属性之间的关联关系,挖掘出的规则在企业决策、个性化推荐、产品设计上都有很高的价值。目前关联规则挖掘领域使用最多的是Apriori算法和遗传算法。但Apriori算法的不足是需要多次扫描事务数据库与生成了大量的频繁项目集;遗传算法存在易陷入局部收敛,收敛速度慢的弊端。本文针对传统算法在关联规则挖掘领域出现的弊端,结合国内外最新的文献,研究工作主要包括以下内容:论文首先介绍了数据挖掘的功能、过程、方法、应用与研究热点等内容。随后阐述了关联规则挖掘的基本步骤,通过一个具体实例和流程图详细介绍了经典Apriori算法的运行过程和存在的不足,在此基础上归纳总结了一些关联规则挖掘领域的优化算法及其思想。其次详细阐述了遗传算法的基本思想,介绍了基本处理流程和基本要素,继而阐明了算法的参数设置方法,在此基础上详细阐述了遗传算法用于关联规则挖掘的可行性与具体步骤。第三是认真学习了人工智能中前沿理论——帝国主义竞争算法(Imperialistcompetitive algorithm,ICA)的思想,国内外的应用情况与运行流程。国内外的文献及实验都证明了该算法可以很快收敛到最优解,不易陷入局部最优。在此基础上提出了基于帝国主义竞争算法的关联规则挖掘方案,详细阐述了使用ICA进行关联规则挖掘的步骤,并使用UCI公开数据集对方案进行了仿真验证。实验结果表明,与GA算法相比,ICA算法在关联规则挖掘上更能达到全局最优,挖掘规则精度更高。最后,本文在学习研究关联规则领域的国内外文献和免疫遗传算法(Immunegenetic algorithm,IGA)理论基础上,针对一篇最新智能算法在关联规则挖掘上存运行时间较长的弊端,提出了三段式编码的改进IGA关联规则挖掘算法。使用三段式编码方案来降低分割点的选取对挖掘结果的影响,使用基于矢量矩浓度的的选择方案来降低算法的运行时间,使用了自适应的交叉与变异因子降低人工设置参数对挖掘结果的干扰。实验仿真结果表明,本文改进的算法在关联规则连续属性挖掘上不降低精度的情况下具有挖掘时间短的优势。
其他文献
随着全国铁路的提速和高速铁路的建设,我国铁路交通发展进入一个新阶段,也预示着我国交通事业的规划向着更高效的方向发展,这使得人们对于铁路建设的安全性提出了更高的要求。智
在国民经济与国防现代化建设中,计算机软件在日常生活中的应用越来越普及,软件可靠性问题日趋受到人们的重视,尤其对于一些安全关键领域,如载人航天、高速轨道交通等。应用于
二值图像连通域标记是指将二值图像中通过给定规则相互连接的像素附上同样的标记,而相互不连接的像素附上不同标记的处理过程。二值图像连通域标记在机器人视觉,人脸识别等相关
随着信息产业尤其是互联网行业的高速发展,使得人们获取和存储数据的能力不断提高,数据库中存储的数据以指数形式不断增长。但在这些海量数据中,真正对于人们有决策价值的知
随着互联网和多媒体信息技术的快速发展,图像信息的数量急剧增加,使得人们获取和检索图像必须面对海量图像数据库。如何从海量的图像库中快速、有.效地检索到所需的资源已经
随着互联网技术的发展越来越成熟,远程教育也越来越受到人们的关注,它给那些希望继续深造但又受到时间、空间限制的人提供了一个很好的学习平台。远程教育是一个全新的教学方
随着经济和物质生活水平的不断提升,中国人口城市化进入高速发展阶段,人口老龄化问题也日渐突出。最新人口普查显示,中国老年人口已接近3亿,相关的医疗监护随之成为社会关注的热
数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性信息的过程。数据挖掘又译为资料探勘、数据采矿,是数据库知识发现中的一个步骤。数据挖掘与统计学、机器
伴随着世界互联网的发展,如合作网、社交网络以及学术引用网络,可以看到复杂网络在我们的日常生活中无处不在。随着人们对复杂网络的进一步研究,逐渐发现复杂网络具有许多重要的
随着信息技术和人工智能的快速发展,计算机逐渐具备模拟人的思维和智慧的能力,计算机视觉成为了一个热门的研究课题。近年来,人脸检测、人脸识别、特征提取、人脸特征点跟踪