基于花朵授粉算法的软子空间聚类算法优化研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:aptxkid2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术、数据收集和存储技术的不断发展,数据规模逐渐扩大、维度逐渐增高,传统聚类算法受高维数据稀疏性和维度灾难的影响无法进行有效聚类,为解决高维数据聚类问题,软子空间聚类分析技术应运而生并得到广泛关注。软子空间聚类通过描述各样本隶属于不同簇的不确定性进行聚类,具有更好的适应性和灵活性、更接近于客观世界。但现有软子空间聚类算法主要存在以下两方面不足:采用随机选取样本点的方法初始化聚类中心,导致算法的聚类精度和稳定性依赖于初始簇心;采用的局部搜索策略,导致算法在聚类过程中易陷入局部最优。本文针对上述问题进行深入研究,具体研究内容如下:(1)针对聚类结果依赖于初始簇心的问题,本文对快速搜索算法(CFSFDP)进行优化,通过引入投影分区和类合并技术,提出一种基于投影分区及类合并技术优化算法(PM-CFSFDP),可以获得更加精准的类中心点。将PM-CFSFDP作为初始化步骤应用于软子空间聚类中,为其选择最佳聚类中心,降低算法对初始簇心的依赖。(2)针对在聚类过程中易陷入局部最优的问题,本文对花朵授粉算法(FPA)进行优化,通过引入混合蛙跳思想和自适应高斯变异策略,提出一种基于自适应高斯变异的混合蛙跳花朵授粉算法(AGM-SFLFPA),可有效避免陷入局部最优且收敛速度较快。将AGM-SFLFPA作为全局优化搜索策略应用于软子空间聚类中,为其搜索最优权值,有效避免陷入局部最优。(3)将两个改进的算法PM-CFSFDP和AGM-SFLFPA引入软子空间中,提出一种基于花朵授粉算法的软子空间聚类算法(FPASC)。在UCI标准数据集上的实验结果表明,在处理高维数据时,FPASC算法可降低对初始簇心的依赖,避免在搜索过程中陷入局部最优,有效提高了软子空间算法的聚类精度和稳定性。
其他文献
随着能源问题的日益严峻,水力发电作为一种清洁可再生的能源越发地受到重视。压力钢管作为水电站的重要组成部分,在电站正常运行维护期,特别是投产的初期和经过多年的运行后,
无线传感器网络(Wireless Sensor Network,WSN)是一门集中了嵌入式技术、微电子技术、传感器技术、分布式信息处理技术和通信网络等技术的交叉学科,在环境监测、医疗卫生、国
随着计算机与网络技术的发展,Web已经成为人类知识的存储库,用户可以方便快捷地接触到丰富的信息。因而在如此浩瀚的信息中找到对自己真正有用的信息成为人们关注的焦点。在
学位
数据挖掘是当前知识发现领域中的一个研究热点,其中的关联分析是一种重要方法。像大多数行业一样,供热企业也存储了大量的数据。面对这些纷繁复杂的供热数据,传统的分析手段
排序学习问题是搜索引擎的核心问题,对它的研究引起了学术界和工业界的广泛关注。传统的排序学习算法主要是从充足的已标号训练样本中学习排序函数,然后将其用来预测同种类型对
在信息化时代,人们对于信息共享的要求越来越高,单个域内的资源共享已无法满足用户对资源的需求,跨域资源访问应运而生。单点登录(Single Sign-on, SSO)使得用户只需在跨域资
分布式拒绝服务(Distributed Denial of Service,DDoS)攻击是当前互联网面临的最严重的安全问题之一。应用层DDoS攻击用于完成特定目标,主要包括中断交易和访问数据库资源。
随着互联网的发展,网络服务器面对众多用户请求的压力也变得越来越大。面对这样的情况,只靠提高单个服务器的硬件性能已远远不能满足需求,而且这些方法的代价十分昂贵,也只能
自从互联网普及以来,电子邮件逐渐成为人们生活中便捷的通信手段之一。但随之产生的垃圾邮件泛滥成灾,除了用户不希望甚至厌恶收到此类邮件以外,垃圾邮件还占用了大量的网络