改进的密度峰值聚类算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:wcyzlh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
密度峰值聚类算法是一种通过寻找密度峰值实现快速聚类的新颖算法,具有实现简单、所需参数少、能处理非凸数据、聚类效果良好等优点。凭借以上优点,密度峰值聚类算法为很多现实问题提供了新的解决思路,并且被应用到众多领域,已成为聚类领域的一个研究热点。然而,由于其还存在无法自动识别聚类中心、对类簇间密度相差较大的数据集还不能有效处理等问题,本文设计了相应的改进算法,提高了密度峰值算法的性能。具体研究内容如下:(1)针对密度峰值算法关于聚类中心的人工识别问题,提出了一种聚类中心自动识别的密度峰值聚类算法。首先,设计了一种适用于不同规模数据集的基于贡献度的密度度量方法,以便能精密地度量数据点的密度并优化决策图的分布。然后,根据决策图上密度与距离的分布特性,设计了新的聚类中心选取方法,能够自动地将那些密度与距离均较大的数据点选取为局部聚类中心,进而形成局部的聚类结果。最后,根据局部类簇之间的共享边界密度信息,将局部聚类自动地合并为全局聚类。实验结果表明,新提出的算法不但能自动地识别出局部聚类中心,并且能够准确地将局部聚类合并为全局聚类,实现了对数据集的自动聚类,解决了密度峰值算法在聚类过程中需要人工选取聚类中心的问题,特对是对某类中存在多密度峰值的数据集,其效果更为明显。(2)针对密度峰值算法对类簇间密度相差较大的数据集聚类效果较差以及其分配策略存在连锁式错分问题,本文提出了一种基于K近邻的密度峰值聚类算法。它将K近邻的思想融入到局部密度的定义和分配策略中,以降低密度信息对聚类中心选取和数据点分配的影响,解决稀疏区域聚类中心易被遗漏和非中心数据点的错分问题。首先,设计了一种考虑数据点空间分布的密度度量方法,它根据数据点周围邻居的分布环绕信息及数据点到邻居的平均距离计算数据点的密度,在保证原稠密类簇的密度值仍较高的同时提高稀疏类簇的密度值,有效降低类簇间数据的不同密集程度对准确识别聚类中心的影响。此外,新的分配策略采用区分边界点方法,分两个步骤对数据点进行分配。首先利用广度优先策略完成非边界数据点的分配,同时自动删减同类中出现的多个聚类中心。然后,依据邻居点的分类情况,逐步完成对剩余数据点的分配。采用这种分配方法无需后续合并操作就可以解决某类中存在的多密度峰值问题,并且有效避免了原算法所产生的连锁式错分问题。在多个人造数据集与UCI真实数据集上的实验结果验证了改进算法的有效性与可行性。
其他文献
学习者与教师、学习资源等要素相互作用的多边互动是网络课程的一个显著特征,然而在网络课程学与教的过程中,学习者与教师、学习者与网络学习环境之间产生互动缺失、互动维持的
环境中微生物资源的多样性,决定了其代谢产物生物活性的多样性。从可培养的环境微生物中已经发现了四环素,氯霉素,利福霉素等。随着这种传统的微生物分离培养方法的继续研究,
【目的/意义】新媒体中反沉默现象具有传播行为的双重性、匿名化的自我性和利益驱动性。它是新媒体所特有的属性,也是现代舆情在互联网环境下外在表现形式。【方法/过程】通
目的 探索Vbeam激光治疗仪治疗颜面部毛细血管扩张症的效果。方法 应用美国生产的Vbeam激光治疗仪 ,波长 5 95nm ,治疗颜面及鼻部毛细血管扩张症 2 5 2例。根据血管的粗细
道德效力是指作为规范形式的道德基于社会秩序的价值定位,对人们的社会行为所产生的应当执行的影响力。法律效力是指法律在属时、属地、属人、属事四个维度中的国家强制作用
连续压机生产线的发展,使人造板实现自动化生产,但缺陷检测环节仍为人工.缺陷识别是检测中的一个重要环节,是根据缺陷特征值利用分类器进行识别的过程.由于人造板连续生产,实
女性虽已大量进入劳动市场,在劳动市场中处于弱势,同时也影响到女性对工会的参与。本文分析了女性参加工会的动机、工会中的性别压力,同时也指出女性之间关系的联结早于工会
现代社会经济飞速发展,人们的娱乐生活悄然的发生了改变,人们通过音乐使自己的生活变得多姿多彩,推动着社会文明的大发展。
在我国大力发展体育产业的浪潮下,优化体育产业市场结构,促进体育消费,是一项重要的举措。北京海淀区高校每年接收大量来自不同国家的留学生,通过对来华的外国留学生进行体育消费研究,促进留学生人群在华进行体育消费活动,为我国发展体育消费市场提供帮助。本文以调查部分海淀区高校不同国家在华留学生体育消费为主要调查对象,采用了文献资料、问卷调查、访谈、数理统计等方法,归纳出海淀区高校部分国家留学生在京进行体育消
角色不同常常引发义务冲突,刑事诉讼角色具有典型性。因为刑事诉讼所涉人员达十多位,角色复杂,立场不同,一人充任两种或多种角色的情况时有发生,当诉讼角色冲突时,如何权衡选