基于多标记激活算法和遗传算法的数据挖掘研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:cyw87325
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是近年来兴起的一个新的研究领域,是当今数据库系统研究和应用领域内的一个热点。关联规则挖掘和聚类是数据挖掘的重要模式,在聚类的结果上进行深入的关联规则挖掘,可以发现个体表现的数据特征与个体具备的因素间的关系。遗传算法具有优秀的鲁棒性和全局寻优能力,已越来越多的被应用到关联规则挖掘中。但是遗传算法的“早熟”现象和后期收敛速度下降的问题严重影响了关联规则挖掘的效率。因此,将遗传算法进行改进,并将其与聚类算法有效地结合,对关联规则挖掘效率的提高有着重要的意义。由于遗传算法的所有操作都是基于实际变量的编码进行的,将编码矩阵化使得遗传算法与聚类算法的结合成为可能,所以提出一种有效的基于矩阵的聚类算法是十分必要的。本文研究了数据挖掘、关联规则和遗传算法的基本原理,分析了多标记传播聚类算法的执行过程,在多标记思想的基础上,提出了一种基于加权矩阵的聚类算法——多标记激活聚类算法,并通过仿真分析了算法的性能。同时,本文研究了传统遗传算法,对其做出了如下改进:首先,提出了利用多标记激活聚类算法的结果智能确定支持度阈值的方法,并在此基础上改进了适应度函数;其次,结合生物的免疫机制,引入了个体免疫力的概念,提出并设计了抗体算子;最后,利用抗体算子对传统遗传算法中遗传操作的交叉算子和变异算子进行了改进。本文将改进的遗传算法应用到关联规则挖掘中,通过仿真验证了算法的可行性和有效性。仿真结果表明,本文提出的多标记激活算法性能更加优越,本文改进的遗传算法有效地提高了最优解精度和求解准确率,加快了收敛速度。在后续的科研工作中,多标记激活聚类算法的矩阵加权处理还有待进一步地研究和探讨;改进遗传算法中对个体免疫系统和抗体算子的完善也是今后继续研究的方向。
其他文献
新一代静止图像压缩标准JPEG2000采用基于上下文自适应的二进制算术编码进行熵编码。算术编码具有卓越的编码性能,在大部分情况下其平均码长都能接近信源熵。然而,它的计算复杂
随着Internet应用的急剧增长,我们需要依靠各种技术手段对网络的性能进行全面的测量和评估,以保证网络服务的稳定性和可持续性,因此,网络测量技术受到越来越多的关注,相关研究已经
运动模糊图像的盲复原算法是图像复原领域一个重要的研究方向。本文采用变分方法来求解单幅运动模糊图像的清晰图像和模糊核矩阵。变分能量方程包含数据项和规则项,数据项可
身份认证技术是信息系统安全的第一道屏障,它是信息安全时代备受关注的一个研究领域。实现身份认证的方法很多,但传统的、单一的认证手段已不适应现今网络系统需求,因此迫切需要
国家“十一五”预研项目“嵌入式半实物仿真测试平台”的研究目的是构建一个评测各种航天软件的通用性测试平台。航天软件测试工作通常在半实物仿真平台下进行,具有较高的实时
组合服务是开放式环境中实现跨组织敏捷应用系统集成的重要技术。目前应用组合服务构建的系统均是采用集中式执行模式。因为集中式执行模式系统在消息传输效率、执行效率、系
自动尿沉渣分类仪器对于临床尿检具有重要的意义。它解决了长期以来传统的通过人工对尿沉渣涂片进行目镜检查的操作过程中存在的受技术水平,视觉上的偏差影响,工作效率低,无
随着数字媒体技术和网络技术的发展与普及,数字视频的生成、传播以及应用变得越来越简单。数字视频的快速增长在为人们提供方便快捷的同时,也带来了各种各样的问题,如通过网络传
Web日志挖掘旨在对Web服务器上的用户访问日志数据使用数据挖掘技术,发掘隐藏在日志数据背后的规律和模式,从大量的Web日志信息中提取出人们需要的有用知识,进而改善Web站点结构
随着信息技术的发展,财政领域的数据访问技术由直接访问后台数据库的方式,改变为通过数据访问中间件访问的方式。采用这种方式能够最大限度的减轻后台数据库的负担,但是同时数据