【摘 要】
:
密度峰值聚类算法是一种基于密度划分的聚类算法,与传统的聚类算法相比具有简单高效、对噪声不敏感、能准确找出聚类中心以及快速分配样本点等优势,近些年广受研究人员的关注。但其本身也存在一定的缺陷,本文针对密度峰值聚类算法在计算局部密度时没有考虑数据集内部结构差异、聚类中心无法自适应、分配样本点时存在的多米诺骨牌效应以及求解局部密度和相对距离时的时间复杂度较高等问题,提出了一系列的改进措施。针对现有密度峰
【基金项目】
:
国家自然科学基金项目(61872105)
论文部分内容阅读
密度峰值聚类算法是一种基于密度划分的聚类算法,与传统的聚类算法相比具有简单高效、对噪声不敏感、能准确找出聚类中心以及快速分配样本点等优势,近些年广受研究人员的关注。但其本身也存在一定的缺陷,本文针对密度峰值聚类算法在计算局部密度时没有考虑数据集内部结构差异、聚类中心无法自适应、分配样本点时存在的多米诺骨牌效应以及求解局部密度和相对距离时的时间复杂度较高等问题,提出了一系列的改进措施。针对现有密度峰值聚类算法存在的聚类中心无法自适应的问题,提出了一种聚类中心自适应的密度峰值聚类算法。该算法通过引入相对密度的概念,剔除数据集中的离群点,选出核心点和潜在聚类中心,以此判断潜在聚类中心之间的连通性,进而实现聚类中心的自适应。同时针对现有密度峰值聚类算法在聚类过程中因为一个点分配错误而引发多米诺骨牌效应,进而导致后续点的聚类结果不理想的问题,提出一种基于最小生成树的密度峰值聚类算法。首先确定聚类中心和核心点,通过核心点确定最小生成树的顶点。然后计算所有顶点之间的欧氏距离,并将其看作最小生成树的边的权值。以任意一个聚类中心为起点,利用Prim算法构建最小生成树,进而完成聚类。本算法解决了聚类过程中因为一个点分配错误而引发多米诺骨牌效应,导致后续样本点均分配错误的问题。经过实验验证,本算法能有效解决传统密度峰值聚类算法的聚类中心无法自适应以及多米诺骨牌效应等问题。针对密度峰值聚类算法在求解截断距离、局部密度以及相对距离等参数时的时间复杂度较高等问题,提出了基于网格筛选的密度峰值聚类算法。将网格的概念引入到该算法中,首先根据指定的参数将数据集划分为多个等宽的网格单元。然后将网格划分为原始分组、二级分组和三级分组,减少计算样本点局部密度和相对距离时参与计算的样本点数量,进而降低时间复杂度。经过实验验证,相较于传统密度峰值聚类算法,本算法在尽可能不影响聚类效果的前提下有效地提高了计算速度。
其他文献
电商的兴起让中国的快递业快速发展,而快递产生的废弃物带来巨大的环境压力,绿色物流的出现则为解决快递污染问题提供新的途径。虽然绿色物流在研究领域与现实实践中都处于新兴发展的阶段,在实际应用中存在一定的难度,但绿色物流在快递公司的全面应用将是降低碳排放量最有效的途径。因此,本文以绿色物流在快递公司的应用为研究对象,运用价值工程的分析方法,对其进行进一步的深入研究,解决绿色物流在快递公司应用过程中出现的
目的 根据一起新冠病毒奥密克戎BA.5.1.3株医院感染暴发的调查,了解其在医院内的传播模式,同时对院内感染控制效果进行评估,为该毒株在医院内的疫情防控提供依据。方法 采用现场流行病学的方法对病例及其密切接触者进行调查,并对本次突发疫情造成的医院感染采取的防控措施进行研究。结果 医院感染暴发时间为8月4日-8月8日,共5例被确诊新冠,潜伏期为1~5 d,平均潜伏期3.0 d。1号首发病例为53岁女
减速器传动系统作为新能源汽车的核心部件,承担着传递动力的重要任务。实际运行过程中,因传动系统本身结构、制造和装配误差、齿轮啮合冲击等原因,减速器传动系统成为汽车室内噪声的主要来源。以新能源汽车二级减速器的传动系统作为研究对象,利用Romax软件构建减速器传动系统的三维模型。基于启动、加速、等速、减速、停车5种典型工况,在Romax软件中对其依次进行静力学分析、动力学分析,导出齿轮最大接触和弯曲应力
信息通信技术的发展,赋予了地图表达极大的自由度,地图学的复兴促进了泛地图的发展。本文系统分析了地图定义的演变,适时论述了泛地图的概念,将传统的标准地图与各种创新形式的类地图纳入统一的泛地图框架下,提出并剖析了泛地图表达的标准地图、写实地图和写意地图分类体系,讨论了泛地图类型、风格化、连续性表示对泛地图表达的作用。
2020年7月,ⅡA发布新“三线模型”,强调组织治理是通过治理机构、管理层和内部审计共同努力达成的结果,明确内部审计向治理机构负责,内部审计独立于管理层,又必须与管理层定期互动,以确保内部审计工作的相关性。中国人民银行聊城市中心支行探索运用新“三线模型”先进理念抓好内部审计整改,收到良好效果,并对如何借鉴相关先进理念、优化内部审计整改进行了思考,提出改进建议。
城市生态公园作为新型城市的城市公园类型,在环境污染逐步加剧的前提下,其规划建设已成为城市生态化发展的重要助推力。然而在城市生态公园建设过程中常常会存在规划问题,导致城市生态公园的生态功能性被大大弱化,规划千篇一律。本文通过对城市生态公园景观规划设计的探讨研究,充分发挥生态公园的价值意义。
众源地理信息作为新型地理信息模式,是指由互联网用户借助交互式平台,通过直接上传传感器数据或提供数字化劳动而贡献的地理信息数据。近20年来,众源地理信息热度上升,并受到越来越多研究者的关注,正在逐渐成为一种重要的地理信息数据来源。本文对近十几年来关于众源地理信息的中文和英文文献进行了系统性的分析与研究,力图展现出众源地理信息研究的发展现状,同时以这些研究发现的规律为基础,结合当前的国际形势,探讨了众
汽车电子驻车齿轮主要由SAE J403碳素钢制成,在其生产过程中,需要对SAE J403进行高频感应淬火过程,由于材料本身或淬火工艺上的差距,会造成齿轮表面形成不同厚度的淬硬层,从而影响齿轮的材料性能和力学性能。通过超声检测装置完成对不同淬硬层厚度碳素钢的信号采集,对采集的超声信号做频谱分析(快速傅里叶变换),获得超声信号基波幅值和二次谐波幅值计算出评定淬硬层深度的非线性超声系数。结果表明,随着淬
<正>1鸽业生产现状1.1种鸽存栏变化产能过剩,行业加速整合。2022年上半年,种鸽存栏明显增加,达到历史同期最高水平(与2019年、2020年、2021年上半年相比,分别增加10.97%、0.94%、3.92%)。全国为“养鸽大户增量,中小户减量”形势,整体产能表现为阶段性过剩。