【摘 要】
:
聚类分析是数据挖掘中的主要组成之一,其任务是利用数据内的相似关系,将数据集划分为多个不相关组,并广泛应用在农业、天文学、工业、医学和物理学等领域。密度峰值聚类算法DPC具有识别数据集簇中心点、快速簇分配和实现简单等优点,但存在人为设置截断度量参数、不合适的簇分配策略和无法识别非球形数据集等缺点,上述问题降低了聚类效果。本文对密度计算问题、簇分配问题等进行了研究。其主要研究成果如下:(1)给出一种基
论文部分内容阅读
聚类分析是数据挖掘中的主要组成之一,其任务是利用数据内的相似关系,将数据集划分为多个不相关组,并广泛应用在农业、天文学、工业、医学和物理学等领域。密度峰值聚类算法DPC具有识别数据集簇中心点、快速簇分配和实现简单等优点,但存在人为设置截断度量参数、不合适的簇分配策略和无法识别非球形数据集等缺点,上述问题降低了聚类效果。本文对密度计算问题、簇分配问题等进行了研究。其主要研究成果如下:(1)给出一种基于相似性的密度峰值聚类算法。该算法首先利用K近邻计算密度,并且利用与其近邻密度和距离的比值得到邻域密度值,给出适应数据分布的密度计算方法,有效地解决了DPC截断距离在选择上的随意性,其次采用共享近邻、逆近邻和密度比,给出基于近邻的相似性计算方法,然后将K近邻替换为最相似近邻,最后利用最相似近邻数据对象,给出了基于距离和密度的簇扩展方法。采用UCI数据集进行实验,验证了该算法有效性。(2)给出一种基于Spark的密度峰值聚类算法。首先该算法在Spark集群内将数据均匀划分放置,然后将共享近邻、密度和相似近邻等中间数据缓存至内存中,并且用多节点参与计算,最后利用相似性扩展聚类簇。利用邻域密度值、相似性扩展簇方法、Spark优越的系统构架和内存运算等特点,提高了簇的区分度和算法的效率。采用人工数据集,实验验证了该算法有好的扩展性。(3)基于上述成果,使用python语言,开发了天体光谱聚类系统。通过运行结果证明,该系统为光谱数据分析,提供了一种有效的分析途径。
其他文献
在我国社会经济快速发展环境下,高速铁路运输成为非常重要的一种交通方式。随着时间的推移、列车车次的不断增加导致钢轨表面出现了多种病害。钢轨表面病害的出现会降低钢轨的质量和抗腐蚀性能,从而对列车的安全行驶造成威胁。为了提高钢轨表面病害检测分类准确率,降低人工的工作量或者完全得取代人工检测,本文提出了基于深度学习的钢轨表面病害分类技术与研究,将深度学习引入到钢轨表面病害分类的工程应用中。本文主要的研究内
科技发展速度越来越快,机器人所涉及的领域逐渐增多,从简单的物体搬运到复杂的喷涂、点焊等领域。由于人工成本高以及传统焊接效率低,点焊机器人逐渐替代人工劳作,不仅改善了焊接质量,而且提高了焊接效率。与此同时,对点焊机器人的应用提出了更多的要求,包括机器人在焊点间移动过程中,关节运动保持柔顺平滑,末端位置准确无误的到达指定焊点;传统点焊路径规划不合理,路径规划需具备科学理论依据,才能保证点焊路径规划的合
图像语义分割是计算机视觉中的一个重要研究方向,在自动驾驶、无人机及医疗等领域有广泛应用。传统的图像分割只能根据颜色、纹理和形状等底层特征对图像进行分割,能达到的分割精准性有限,无法满足实际需求。而图像语义分割则是在图像分类的基础上将分类对象由图像转变成了像素点。近年来,基于深度学习的交通场景图像语义分割技术成为一个新的研究热点,受到越来越多学者的关注。起初,基于深度学习的图像语义分割多是通过简单地
实际系统中普遍存在着的不确定性与时滞现象,会降低系统性能甚至引起系统不稳定。因此,研究时滞不确定系统稳定性与控制方法具有重要的理论意义和实际价值。滑模变结构控制对外界扰动及系统参数变化表现出较强的鲁棒性,已经在多类系统中得到了验证。本文以滑模控制理论为基础,结合Lyapunov稳定性定理、线性矩阵不等式和自适应理论分析三类不同的时滞系统,并设计具体控制方案。(1)针对时滞系统中存在的参数摄动和不确
随着制播技术的发展,有声语言在视频中的表达方式愈加丰富,视觉化趋势愈加凸显。多屏时代的媒体环境对有声语言传播提出场景化、情感化和话题性的新要求,本文以文化类节目为例,分析有声语言通过声音、图像、文字、视频等元素的多模态表达对节目表现力的提升作用,进一步探讨文化类节目的多平台传播创新。
随着海洋战略的实施,海工装备是实现海洋强国目标的重要环节之一。在海洋环境的影响下,深海起重机起吊点垂直方向的剧烈运动给起重机海上作业造成严重影响,使得钢丝绳或脐带缆断裂。主动升沉补偿可以减弱该影响。本文从深海起重机主动升沉补偿的控制方法入手,实现起重机深海环境下的安全作业。首先,利用海洋波浪动力学和牛顿第二定律搭建深海起重机的传递函数,将传递函数通过系统方框图建立状态空间方程,为互补滑模控制律的设
现如今,工业机器人之所以在各个工业领域随处可见,是因为其具有高效、节能、环保等优势。在机器人研究领域,工业机器人的轨迹规划一直都是研究热点,其目的是在给定约束条件下,在某些特定点之间,寻找一条光滑、省时节能且低残余振动的关节运动曲线,使机器人以高性能完成不同工作任务。本文主要针对六自由度工业机器人从时间和能量两个方面进行研究,主要研究内容如下:(1)使用旋量理论建立了机器人运动学模型,并对机器人正
交通标志中包含了重要的道路指示信息,由于车辆行驶道路复杂、标志种类繁多等原因,使得交通标志检测与识别成为智能交通和无人驾驶研究的热点问题。交通标志牌长期暴露在室外环境下,容易出现受损、被遮挡等情况,从而使得交通标志检测与识别系统效果较差,不能较好地满足驾驶员所需要的辅助驾驶信息。本文在YOLOv4算法与胶囊网络的基础上,实现了交通标志检测与识别,开展了以下工作:(1)针对交通标志检测中小目标检测效
近年来,光学字符识别(Optical character recognition,OCR)技术得到了非常广泛的应用,其相关算法也在字符检测和识别的运用中逐渐成熟。在工业场景下,铸造工件上的标识字符有着举足轻重的作用,通过标识字符可以查询到整个铸造过程中各个环节的详细信息。如果利用OCR技术去自动识别标识字符将大幅减少人们的工作,提高工作效率。但是在背景与字符低对比度的情况下,传统的OCR技术存在抗
随着科学技术的发展和人民生活水平的提高,人们对车辆自主化及智能化的需求逐渐提高,智能车辆技术也在稳步发展。面对复杂的交通环境,智能车辆将会对其驾驶行为做出自主决策,实现自动驾驶功能。换道行为是最常见的驾驶行为之一,智能车辆的换道行为与驾驶员操作相比,在安全性、舒适性及高效性等方面有明显优势。本文研究工作属于车辆辅助驾驶技术研究范畴,针对动态环境下智能车辆匀速换道行为的决策、规划、执行展开研究,以下