【摘 要】
:
密度峰值聚类算法作为一种基于密度的算法,能够快速寻找到簇心完成聚类。但该算法存在一些缺陷:(1)局部密度定义较为简单,未考虑数据的空间结构特点且无统一的度量标准。(2)簇心选取时过于依赖单一的局部密度,导致簇心与非簇心区别不明显。(3)单一的分配策略易导致连续性分配错误。以上三个问题导致传统密度峰值聚类算法的的聚类性能不佳,尤其在复杂数据集上表现异为明显。本文针对这些问题展开研究,并将改进后的聚类
论文部分内容阅读
密度峰值聚类算法作为一种基于密度的算法,能够快速寻找到簇心完成聚类。但该算法存在一些缺陷:(1)局部密度定义较为简单,未考虑数据的空间结构特点且无统一的度量标准。(2)簇心选取时过于依赖单一的局部密度,导致簇心与非簇心区别不明显。(3)单一的分配策略易导致连续性分配错误。以上三个问题导致传统密度峰值聚类算法的的聚类性能不佳,尤其在复杂数据集上表现异为明显。本文针对这些问题展开研究,并将改进后的聚类算法应用于系统故障诊断分类中。具体工作如下:(1)提出K近邻和逆近邻优化的密度峰值聚类算法。统一了局部密度的计算,使用可描述数据空间结构的的K近邻和逆近邻共同定义了局部密度度量方法,充分展现数据的空间分布特点。其次,为便于寻找簇心点,将逆近邻的优势增加到决策值的计算中,使得簇心点相比于非簇心点在决策值图中处于更加明显的位置。最后,融合了距离和逆近邻的信息对数据点进行分配,仍未分配的点按照其邻域特点完成分配。(2)提出共享K近邻和多分配策略的密度峰值聚类算法。通过共享近邻对数据点的相似度重新定义,解决相似度计算时仅考虑距离这一问题。同时,在局部密度计算中引入放大因子,使决策值图中簇心与非簇心点的差异性更大,便于找到簇心。最后,优化了非簇心点的二次分配策略,避免了可能产生连带错误现象。(3)将本文提出的优化密度峰值聚类算法运用于系统的故障诊断分类中,核心是通过SKM-DPC(Shared K-nearest neighbors and Multiple Assignment Policies Density Peaks Clustering Algorithm)算法来为SVM(Support Vector Machine)选择训练数据,运用聚类的优势排除无关数据,加强了所选择训练数据间的相关联性。实验取得了较好的结果,为故障诊断提供了一定技术支撑。(4)设计了简单的聚类分析系统和故障诊断分类系统。
其他文献
推动农村能源低碳清洁高效利用对于实现双碳目标起到不可或缺的作用,因此农村可再生能源推广应用的重要性日益凸显。随着农村能源变革的进行,农户对能源消费有新的需求。但是现有能源企业目标客户多集中在用能量大且集中的园区、工业企业等,长期以来忽视农村地区的柔性用能。当能源供给方式改变时,农户会适当调整以往习惯的用能行为,包括设备使用强度和使用时间的调整。农户的这种柔性用能调整意愿对于小型能源企业在农村发展可
汉字教学一直以来是对外汉语教学研究的重点内容。近年来汉字教学虽然取得了很大的成就,但是如何加强汉字教学的针对性以及提高汉字教学效果依然是值得探讨的问题。随着中国国力的日渐强盛,海外汉语学习者的增多,学习者年龄也呈现出低龄化现象,海外儿童成为汉语学习者的庞大群体。汉字作为记录汉语的书写符号系统,有着其自身的独特性,但因汉字难学、难教等问题,使得针对海外儿童的汉字教学方法一直处于探索中。汉字作为汉语的
地域性,是山水画研究领域很重要的一个问题,山水画家选择地域特征突出的景色入画,对于绘画题材的选择,应该重视个人潜能的挖掘。我国地大物博,山河壮丽,所以历代中国山水画家都愿意在大自然中寻找自己的表达方式,这样也能够形成自己独特的艺术风格。本文从地域性特征的角度对何海霞的山水画进行研究。第一部分对本文的研究背景进行相应的论述,这部分主要从研究方法和研究思路两个方面进行全方位的阐述;第二部分先是对地域性
随着无人驾驶和车路协同技术的发展,基于融合感知、云边一体、协同决策等技术的优势,露天矿在当前数字化、智能化的基础上也将向着网联化、协同化目标发展。通过“车—路—云”三要素的有机耦合,露天矿运输作业场景必将发生革命性变化。怎样在未来车路协同的环境下高效且合理地对无人矿卡进行车流规划调度,提升露天矿企业的经济效益,是当前露天矿企业所面临的问题。针对基于车路协同的露天矿无人矿卡车流规划调度问题,本文展开
建筑业是我国经济的支柱性产业,具有较强的关联度和带动性。因产业链条长、应税环节多、适用条款复杂、进项税来源广泛等原因,建筑行业是税务部门重点关注的行业。近年来,国家税务总局多次对建筑业进行专项检查,每年都会发现大量的涉税问题。所以,如何加强内部控制体系建设,降低税务风险,已成为制约建筑行业高质量发展的重要因素。CY建筑公司深耕建筑行业20多年,是阜阳建筑行业的龙头企业。在2020年下半年审计署南京
厌氧动态膜生物反应器(AnDMBR)是利用大孔径的廉价微网为膜组件的支撑材料,替代AnMBR工艺中的微滤/超滤膜,具有处理水质好,膜材料价格低廉、占地面积小、膜易清洗和再生等优点。然而AnDMBR作为一个新兴的工艺,也存在一定的缺点与不足,如动态膜的形成过程、膜基材的选择以及稳定运行条件优化等方面仍然有待探索以获得更广泛的应用。研究认为生物气循环可以强化传质过程和调控泥饼层结构,有利于提升生物处理
<正>口腔癌为头颈部常见的恶性肿瘤,是全球常见的六大恶性肿瘤之一[1]。口腔癌多发生于老年男性,5年生存率约65%,整体生存质量不高[2,3]。在目前的医疗条件下,早发现、早治疗是控制口腔癌,提高患者生存质量及生存率的关键[4,5]。本文介绍1例左舌缘溃疡病理活检为慢性炎症,自体荧光阳性并最终诊断为口腔鳞癌患者。