基于流形距离核的谱聚类算法研究及其应用

被引量 : 0次 | 上传用户:yetigai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,谱聚类算法在模式识别中获得了广泛的应用,是目前较为流行的聚类分析方法之一。谱聚类算法是以谱图理论为基础的,与之前人们所熟知的聚类方法相比,其克服了传统聚类算法只能在凸图形上聚类的缺点,除此之外该算法具有收敛到全局最优解的优点。谱聚类算法首先是对相似矩阵进行特征分解,将得到的特征向量构造成新的简化的数据空间,即降低了数据维度又使待聚类的原数据在子空间中的分布结构更加清晰。为了更好的反映原数据中点与点之间的关系,本文提出将流形距离引入谱聚类中得到一种基于流形距离核的谱聚类算法。本文的主要内容包括以下几个方面:1.系统介绍了聚类分析以及谱聚类算法,在谱聚类的基础知识中又介绍了图的基本知识、矩阵表示、度矩阵及拉普拉斯矩阵,并系统阐述了谱图理论、图划分准则以及谱聚类算法的实现。2.针对原始谱聚类基于欧式距离的相似性度量,提出一种能够反映数据聚类复杂空间分布特性的基于流形距离核的谱聚类算法,它能充分挖掘数据集中的内在结构信息,从而较好地反映局部和全局一致性。该算法在具有“挑战性”的人工数据集中得到了很好的验证,并且选择几个UCI数据集作为实验数据,将本文提出的谱聚类改进算法同其它聚类算法进行分类比较,实验结果表明此改进算法具有很好的聚类效果。3.将改进后的谱聚类算法作为欠取样的一种方式,提出一种基于流形距离核的谱聚类欠取样方法,用于SVM不均衡数据的分类中,从而解决数据不均衡性,因此提高了SVM分类器的性能。最后利用基于流形距离核的谱聚类欠取样SVM算法对滚动轴承故障检测数据集进行检测性能测试,并同其他对于不均衡数据预处理的算法进行检测性能比较,结果表明,对于滚动轴承故障,该算法具有较好的检测性能。
其他文献
针对密集波分复用系统中,对特定波长光信号进行精确选择与提取的需求,本文将光纤谐振环与马赫-曾德尔干涉仪相结合,设计出一种新型的光学滤波器。采用信号流程图理论和光纤谐
近年来,随着我国汽车保有量的迅速增加,严峻的交通拥堵问题随之产生,从而使人们对城市道路交通流状态的信息需求更加迫切。视频检测由于它的信息量丰富,安装简单,成本低等特点成为
目前,我国边境地区的外部安全形势错综复杂,内部安全问题不断凸显,部分边民的国家安全意识不足,加强边民的国家安全教育具有紧迫性和必要性。边民国家安全教育存在重视程度不
水对于人类是大自然的馈赠,是生命之源。园林理水是人类自古流传下来以便将自然山水更贴近于生活的造园活动,发展至现代,水景的营造以其改善生态环境的功能和独特的魅力在城市园
高精准度时间分辨率是正电子断层扫描仪(Positron Emission Tomography,PET)的重要指标之一。本论文研究基于目前快速发展的数字化技术,对现有PET符合系统中负责时间信息提取部
中西方绘画中的线体现着各自不同的空间意识、美学理念以及有着不同的表现形式;中国画用线的传统形成了独特的、富有东方艺术特征的艺术语言;中国传统绘画对线的极致讲究随着不
随着中国改革开放的不断深入,使得中国企业,尤其是乘用车企业不断融入竞争日趋激烈的国内外市场中,而成本优势的逐渐丧失使得如何找到并获取新的核心竞争力成为当务之急。所以丰
近年来,我国的小微企业发展迅速,在扩大就业、提高收入、增加国家税收等方面具有举足轻重的作用。自2008年以来,我国不断扩大小微企业税收优惠的范围与力度。本文主要针对最
初高中历史教学衔接一直是广大历史教育研究者和中学历史教师关注的问题。新课程改革实施后,初高中历史课程在课程体系、内容编排、知识深度和广度、教法和学法等方面都发生
随着经济的快速增长,矿产资源行业在国民经济发展中的作用日益显著,矿产资源的急剧消耗已经成为制约我国可持续发展的瓶颈。因此,在传统找矿模式的基础上,寻找快速有效的找矿新方