改进的密度峰值聚类算法研究

来源 :南京信息工程大学 | 被引量 : 3次 | 上传用户:lahaidong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘的主流技术之一,聚类算法具有“多样性”与“针对性”等特点。多样性是指算法种类繁多,针对性是指算法的应用场景有针对性。按照不同的度量标准,聚类算法主要可以划分为以下几个类型:划分聚类、层次聚类、密度聚类、网格聚类、模型聚类等。密度峰值聚类算法是一种高效的密度聚类算法。本文针对密度峰值聚类算法的缺陷进行了研究与分析,并提出了两种改进算法,主要成果如下:(1)针对密度峰值聚类算法会把异常点分配给离它最近的簇,通过二维决策图检测簇数不准确的问题,提出了一种基于引力理论的密度峰值聚类算法,将万有引力理论应用于密度峰值聚类算法,以增强其检测异常的能力,通过万有引力理论优化决策图,以参数重力的倒数来代替距离作为决策图的纵坐标,使其具有准确识别异常和质心的能力。(2)针对单个聚类包含多个密度峰值,密度峰值聚类算法将每个不同密度峰值视为潜在聚类中心,难以在数据集中确定正确数量聚类的问题,提出了基于CURE的混合密度峰值聚类算法。首先,找到密度峰值作为初始簇中心,划分数据集为子簇;然后,借鉴层次聚类算法CURE(Clustering Using Representative),从子簇中选取分散的代表点,对拥有最小距离的代表点对的类进行合并,引入参数收缩因子,控制类的形状。本文提出的两种算法与原始密度峰值聚类算法和其他经典聚类算法分别在合成数据集和UCI数据集上进行了聚类比较和分析,根据实验结果可知,在处理各种类型数据集时,本文提出的改进算法与原始密度峰值聚类算法及其他经典聚类算法相比,可以具备识别任意形状,不同大小,不同密度类簇的能力,可以准确识别簇数,并且检测异常。聚类效果较好。
其他文献
目的 观察不同固定方式急诊治疗多发伤合并胫腓骨开放性骨折的疗效.方法 选取2015年1月~2017年12月我院收治的多发伤合并胫腓骨开放性骨折患者80例为研究对象,随机分为参照组
为研究冻融对混凝土碳化的影响,对4种不同配合比混凝土先后进行冻融循环和加速碳化,测定其CaCO3含量,并采用Boltzmann函数拟合碳化深度值。结果表明,冻融作为混凝土损伤的动
企业文化通常被描述为反映企业自身特点、企业员工普遍认同和遵守的价值观和行为规范体系。从这个描述上看,企业员工应该是执行企业文化的主体,而这个主体又是企业人力资源管
日前,“美团”平台提出了“新社会企业”概念,聚焦互联网平台的价值与责任。社会企业是指以优先追求社会效益为根本目标,持续用商业手段提供产品或服务,解决社会问题,创新公
针对新一代飞机机电系统功能高度集成、系统架构和接口设计复杂等特点,基于LMS Imagine.Lab仿真平台,开展了基于模型的机电系统多物理域仿真技术应用研究。采用系统建模软件A
广陵书社出版的《鸳鸯蝴蝶派与早期中国文化创意产业1919-1930》一书以鸳鸯蝴蝶派为典型个案,立足文化创意产业而不是通俗文学的视角,独辟蹊径地深入中国文化创意产业历史发
随着改革开放及人们文化生活水准的不断深入、提高,我市的演歌厅行业近年也有较大发展,为了解其卫生状况,以便提出相应防御措施,我中心于2009年4月对我市50户演歌厅进行了卫
益母草临床应用于痛经、闭经、难产、产后恶露不下以及分娩后助子宫整复等妇产科疾病外,对急性肾小球肾炎、急、慢性肾炎水肿,中心性视网膜脉络膜炎、原发性高血压、小儿疳
本文对10k V线路氧化锌避雷器的结构原理进行简要介绍,然后对两种氧化锌避雷器的故障诊断方法进行探究,再就10k V氧化锌避雷器故障产生的原因进行分析,并提出相应措施。存在
本文从超高层建筑的特点及作用出发,以笔者设计佛山荣耀国际和广州正佳国际项目经验出发,对超高层建筑核心筒设计归纳总结,探讨超高层办公建筑核心筒设计的原则及要点,以供参