一种基于密度和距离的K-means聚类算法

来源 :软件工程 | 被引量 : 0次 | 上传用户:chloexg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对K-means算法中对初始聚类中心和孤立点敏感的缺点,我们通过从密度和距离两个方面的改进,提出新的改进K-means算法。该算法引入特征权重,从近邻密度出发,去除孤立点对算法的影响,同时确定初始聚类中心,在距离计算过程中,引入集成簇内与簇间距离的计算方法,以提升聚类的效果。实验结果表明,该算法比传统聚类算法能够提升10%以上的聚类效果。
其他文献
装备保障性验证是控制装备保障性达到目标要求的有效手段,目前,装备保障性验证领域积累了很多技术方法以及海量异构的数据。知识图谱具有对知识、数据进行梳理从而进一步实现机器智能的作用。构建装备保障性验证领域知识图谱也将是装备保障性领域迈向智能化的开端。首先简要介绍装备保障性验证发展现状,其次概括知识图谱构建的技术方法和研究热点,然后提出装备保障性验证领域知识图谱构建方法以及逻辑和技术流程,最后对未来发展
针对电动汽车串联电池在电路中的不一致性问题,对钛酸锂电池组不一致性的原因和均衡方法进行了详细分析,通过对比研究主动均衡和被动均衡,并结合具体需求,设计了基于电压的被动均衡控制策略,采用Matlab/Simulink对电池组均衡策略进行模型的搭建,并进行仿真验证。通过实验测试验证均衡控制策略的有效性。
Hadoop存储海量小文件将导致存储和计算性能显著下降。本文通过分析HDFS架构提出了一种基于文件类型的小文件合并方法,即根据文件类型将相同类型的小文件合并为大文件,并建立小文件到合并文件的索引关系,索引关系存储于HashMap中。为了进一步提高文件读取速度,建立了基于HashMap的缓存机制。实验表明该方法能显著提高HDFS在存储和读取海量小文件时的整体性能。
对西藏某氧化铜矿石进行了可选性试验研究。试验根据矿石的工艺矿物学特性,以传统的硫化浮选工艺为基础,采用“硫氧分步粗选-粗精矿混合精选”的工艺流程并辅之以新型高效浮选
在无人驾驶和驾驶辅助领域,交通标志识别是非常重要的。利用YOLOv4算法的实时性检测效果,本文提出了一种基于YOLOv4的交通标志识别框架,主要识别LISA数据集中的四种交通标志:禁止标志、行人通过标志、前进标志、限速标志,为了进一步提高YOLOv4的实验性能,采用K-means算法对实验数据进行聚类分析,确定适合LISA数据集的先验框大小,实验结果表明改进后的框架对比原始的yolov4框架和YO
针对目前私家车保有量快速增长,城市车位资源紧缺,停车困难,设计了一款基于物联网平台和MQTT传输协议的"枫停"智能车位锁控制系统。使用IOT设备、移动端、服务器三端数据交互,实现软硬件结合的APP控制系统。软件可监控附近的车位状态、车位锁状态,以实现移动端对硬件的操控。对比现在市场上已有的多种蓝牙车位锁,该系统具有信号稳定、设备成本低、移动端使用便捷和寻找车位周期短等优势。
针对面积估算普遍存在于工程计算当中,工作量大,计算复杂的实际情况,开展了基于计算机高级语言课程的面积估算研究,以蒙特卡罗抛洒法估算图形面积实现层次分明的定积分计算,有效解决了面积估算过程中计算的复杂度,引领学生产生高成就感的深度学习行为,训练了计算思维能力。
信息平台的使用,能够大大提高系统的运行效率以及对系统的监控力度。本文以卡车物流中心信息平台为研究对象,首先对其进行平台需求、平台设计要素、平台结构以及平台中的各主要功能模块的分析。然后利用Visual Basic6.0和Access数据库实现了其主要的功能模块。通过该信息平台的设计,旨在为卡车相关供需企业及政府部门之间建立交流的桥梁,从而提高卡车物流中心的信息化程度。