【摘 要】
:
密度峰值聚类算法在人工确定聚类中心之后仅通过一次遍历就能实现非聚类中心点的有效分配。该算法思想简单且具有较强的实用性,但仍存在一些亟待解决的问题,如基于全局参数dc计算局部密度和斥群值且聚类结果对dc敏感,无法自适应确定聚类中心,处理密度不均数据集时准确率较低,处理复杂流型结构数据集时容易错误分配剩余样本点等。本文针对上述问题提出对应的改进策略。针对密度峰值聚类算法存在的dc敏感,需人工确定聚类中
【基金项目】
:
国家自然科学基金(61872105);
论文部分内容阅读
密度峰值聚类算法在人工确定聚类中心之后仅通过一次遍历就能实现非聚类中心点的有效分配。该算法思想简单且具有较强的实用性,但仍存在一些亟待解决的问题,如基于全局参数dc计算局部密度和斥群值且聚类结果对dc敏感,无法自适应确定聚类中心,处理密度不均数据集时准确率较低,处理复杂流型结构数据集时容易错误分配剩余样本点等。本文针对上述问题提出对应的改进策略。针对密度峰值聚类算法存在的dc敏感,需人工确定聚类中心以及处理疏密变化较大的数据集时准确率较低的问题,提出一种基于自然邻居的密度峰值聚类算法。该算法首先利用pr值代替样本点的局部密度;其次根据聚类中心的特点并结合自然邻居思想自适应筛选聚类中心;然后应用自然邻居扩散的方法对低斥群值点进行初步聚类形成聚类骨架,并将高斥群值点填充到其多数自然邻居所属的聚类骨架中;最后将剩余样本点与其最近邻点划分到同一个类簇中。对比实验结果表明,该算法在多个实验数据集上均能得到较优的聚类结果且在处理密度不均数据集上具有较大优势。针对密度峰值聚类算法存在的dc敏感,需人工确定聚类中心以及处理复杂流型结构数据集时易出现样本点连锁错分的问题,提出了一种基于KNN优化的密度峰值聚类算法。该算法首先基于KNN定义新的局部密度以及斥群值的计算方法;其次通过探测决策图中的点间隔断确定聚类中心点;然后根据设定的阈值将剩余点划分为内部点,边界点以及离群点,并将内部点分配到与其近邻相连的聚类中心点所属的类簇中;最后将边界点分配到隶属度最高的类簇中。对比实验结果表明,相比于实验中的其他算法,该算法具有较高的聚类准确率且在处理复杂流型数据集上具有较大优势。
其他文献
计算机断层扫描(Computed tomography,CT)在临床应用中实时快捷、图像质量高,已经成为脊柱类疾病检测的主流成像方法之一。从CT图像中分割出椎骨是脊柱类疾病诊断和治疗的重要步骤。传统分割方法或者基于机器学习技术在分割性能和效率方面均满足不了实际临床应用的需求,深度学习尤其是卷积神经网络的强大识别能力使得它能够得到显著优于其它方法的分割结果。本文研究基于深度卷积神经网络AM-UNet
近年来,随着人工智能在生活生产中的大规模应用,深度学习算法也被越来越多的研究者关注。卷积神经网络作为深度学习中应用较为广泛的算法,在诸多领域都取得了较好的效果。但是随着网络规模逐渐增大,对应的计算量也随之快速增大,限制了网络模型的应用场景。目前主流的神经网络部署平台以CPU,GPU为主,但是这两种平台功耗较高,设备尺寸也较大,无法部署在一些有功耗限制的移动端应用场景。二值化卷积神经网络将权重量化为
随着物联网技术及其相关应用的飞速发展,射频识别标签、低端智能卡、无线传感网络以及大量的小型设备逐渐融入到人们的社会生活中。在物联网技术与人们的日常生活关系日益紧密的同时,信息传输的安全性引起人们的高度重视。哈希函数是常用的信息加密技术之一,由于物联网技术的相关设备在计算能力,内存大小和功率等方面具有若干限制,这些限制给常用的哈希函数带来了挑战,因此轻量级哈希函数应时而生。利用可重构技术设计可重构密
树脂基复合材料压力容器具有质量轻、耐腐蚀、抗疲劳等优点,已应用于航空航天、军事、能源工业等领域。但树脂基复合材料容器在冲击载荷下易发生树脂基体失效,严重限制了其在可移动、冲击环境等领域的应用。为提升复合材料压力容器耐冲击性能,可以采用不带树脂的干纤维缠绕增强压力容器。然而,不同于传统的湿法纤维缠绕成型结构,干纤维缠绕由于没有树脂基体对纤维的浸润、粘接及应力传递作用,其成型过程对纤维落纱点精度及纤维
采用真空蒸镀和磁控溅射技术,制备了结构为Cu/Co Pc(Cu Pc)/Al的薄膜二极管和结构为Cu/Co Pc(Cu Pc)/Al/Co Pc(Cu Pc)/Cu的薄膜晶体管,对制备的器件在不同湿度环境下的电学性能进行了测试,通过计算表征器件的物理参数,探究该器件的工作原理,解析湿气对器件的影响机理,以及该器件作为湿度传感器的可能性。首先测试了有机薄膜二极管的在不同湿度环境下的特性。结果表明,水
智能体(agent)广泛应用于人类难以到达的领域,如地形探索、恶劣环境搜救等,这些复杂任务对agent路径寻优提出挑战。单agent难以完成复杂路径寻优任务,学者开始对多agent路径寻优展开研究,基于显式通信进行精准计算的精确算法虽然可以求得最优结果,但只有给出严格数学依据才能得出最优解,算法时间复杂度随问题规模和agent数量增长,只适用于整体复杂度较低且路线较少的情况;启发式算法虽然能够在可
聚合物基纳米电介质具有优异的绝缘和力学性能,广泛应用于微电子、电气绝缘和新能源等领域。随着5G信息时代来临,集成电路产业飞速发展和尖端科技不断革新,对聚合物基纳米电介质的综合性能(尤其是绝缘性能)提出更高的要求。UiO-66(典型的Zr-MOFs)作为一种近年炙手可热的新型纳米材料,其比表面积大和易于修饰的特点,可以用于制备新型聚合物基纳米电介质材料,但目前相关报道较少。本文利用溶剂热法制备UiO
螺纹插装式液压阀是继板式阀、管式阀、叠加式阀和二通插装式阀之后的又一种液压控制阀,其具有零泄漏、结构紧凑、加工改型相对容易、连接简单、重量轻、成本低等优点,有非常广阔的应用前景,是液压控制技术的一个重要发展方向。本文以一款螺纹插装式电磁换向阀为研究对象,采用多物理场耦合的仿真方法,对其流量压力特性、高温高压形变、电磁驱动性能和过渡过程特性等进行了系统的仿真研究与理论分析。研究成果对于该类阀的设计、
随着大数据和人工智能的快速发展,数据也随之变得愈来愈复杂,人们开始对这些多样的数据展开研究。正因为数据的多样性,不确定数据也随之衍生出来。数据的不确定性主要包括两方面,一方面是数据自身的不确定性,另一方面是数据属性级别的不确定性。本文主要针对确定数据和不确定数据做了相应的研究。首先针对确定数据在聚类时随机选取数据作为初始聚类中心以及对初始聚类中心敏感的问题,提出了一种新的模糊C均值聚类算法。然后针
阿尔兹海默症(Alzheimer’s Disease,AD)作为一种威胁老年人生命健康的退行性疾病,伴随着记忆衰退和认知障碍,对人们的生活和社会的发展都产生极大的影响。全球人口老龄化日益严重,有关AD的研究也逐渐成为医学领域的热点。由于AD早期症状不明显,等到发现时多处于中期甚至晚期阶段,导致患者错过最佳的治疗时间。因此,尽早的发现和治疗是延长患者存活时间的关键。由于广泛使用的机器学习模型在各个A