基于图论的谱聚类算法研究和实现

被引量 : 0次 | 上传用户:wangzhaohai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析在信息检索和数据挖掘等领域都有很广泛的应用,是人们认识和探索事物之间内在联系的有效手段。聚类算法能够在没有任何数据先验知识的情况下对数据进行分群,从而找到数据中有价值的信息。谱聚类算法作为一种新型的聚类分析的算法,与常用的k-均值聚类方法相比,谱聚类具有明显的优势,该方法不仅不易陷入局部最优解,而且具有识别非凸分布的聚类的能力,能够对任意形状的样本空间进行聚类,适合于许多实际应用问题。谱聚类算法是一种基于相似矩阵的聚类算法,使用谱图理论对相似矩阵进行划分。传统的谱聚类算法首先定义样本数据集的距离度量,基于距离度量获得相似性度量,由相似性度量构造样本数据集的相似度矩阵W,之后求出拉普拉斯矩阵L,计算出L的特征值和特征向量,最后选择一个或多个特征向量就可以对不同的数据点进行聚类。由于谱聚类算法直接在相似矩阵上进行分割,不同形式的相似矩阵对算法的影响很大,因此研究关于相似矩阵对谱聚类算法的影响以及如何构造一个适合谱聚类分割的相似矩阵问题,这些问题对于谱聚类算法来说,是具有研究意义的几个方面。本文详细介绍了谱聚类算法的相关理论和方法以及谱聚类生效的原因和优势,并指出了传统的谱聚类算法受相似矩阵影响的问题。最后做了以下两个主要的工作:第一,为了验证谱聚类算法相比k-均值算法能够在任意形状的样本空间上可进行聚类且不易陷入局部最优解两个方面上具有的优势。本文在构造谱聚类算法最后一步操作时,采用k-均值聚类算法,目的是为了对比谱聚类算法和k-均值聚类算法。算法代码在matlab7.0上实现,统计分析k-均值算法和谱聚类算法在基于图的初始样本数据集上的实验结果,说明谱聚类算法比k均值算法在聚类准确性和适用性范围上具有改进。第二,虽然目前已经有了多种谱聚类算法,但是其区别仅在于所处理的矩阵不同,矩阵的谱和特征向量与聚类之间的关系并不十分地清楚,而且现在也还没有完整的理论来描述和界定谱聚类方法的性能和分析其局限性。由于谱聚类算法直接在相似矩阵上进行分割,在此,首先介绍一些目前存在的相似矩阵的构造方法,包括不同的距离公式产生的相似矩阵,不同的特征类型产生的相似矩阵以及不同的特征整合方法产生的相似矩阵,然而不同形式的相似矩阵对算法的影响很大,因此找到一种新的阻尼矩阵来代替相似矩阵,减少相似矩阵对算法的影响。改进的谱聚类算法并不是直接对相似度构造的相似矩阵进行聚类分析,而是对由阻尼距离构造的阻尼矩阵进行聚类分析。算法代码在matlab7.0上实现,统计分析改进的谱聚类算法和传统的谱聚类算法在基于图的初始样本数据集上的实验结果,说明改进的谱聚类算法比传统的谱聚类算法在聚类准确性上大部分情况下具有改进,也进一步丰富了构造相似矩阵的理论。
其他文献
工笔花卉是工笔花鸟画中的重要一类,具有独特的审美特征。喜欢工笔花卉的人越来越多,了解它的审美取向、感受它的精湛美、体验它的技法美、享受它的意境美,对工笔花卉的鉴赏
绘画艺术的发展在不同的环境中呈现出不同的形态。中西绘画艺术从神秘的远古时期发展到今天的多元文化交流的信息时代,可谓此起彼伏、绚烂多彩。文章主要通过对中西方绘画教
装饰画是当前环境装饰的重要组成部分,对于提高环境的艺术文化表现力具有一定的作用。随着装饰绘画艺术的发展,综合材料的运用已经成为其重要的发展方向,因此,文章就综合材料
"无"之道的"无"往往有助于设计传达信息、交流情感,起到以少胜多、提升作品感染力和创造作品意境的作用,正如清人戴熙所讲"画在有笔墨处,画之妙在无笔墨处"。文章主要从疏与
经过农村小学美术课堂的教学实践和对农村小学美术教学现状的调研发现:当前部分地区的农村小学美术教育仍然较为滞后,受客观条件限制较严重。一些农村学校经费紧张,美术教师
要设计好校园的生态环境,首先要明确校园生态环境的内涵与价值,把校园环境放置在社区的生态环境系统中开展设计,以生态的校园园林景观设计为主要载体,设计出绿漫校园、生物多
目的流式细胞术检测NB4和U93 7细胞内活性氧 (reactiveoxygenspecies,ROS)的水平。 方法双氢罗丹明 12 3 (DHR)以不同的时间孵育细胞 ( 1、6、2 4h) ,DHR可被细胞内ROS氧化
提出并实现一种单目弹载图像恢复跟踪目标3D信息的方法,该方法结合导弹的运动航迹和高度信息构建出多目立体视觉三维重建模型来恢复跟踪目标的3D信息,增强了导弹的跟踪和识别
综合电子系统是皮卫星的数据和指令枢纽,承担皮卫星数据处理、数据存储、数据传输及指令收发、响应等重要任务,是皮卫星的核心组成部分。皮卫星综合电子系统大都采用高性能商
随着中国市场的蓬勃发展,众多跨国公司纷纷加大了对华投资的力度,如何迅速的占领中国市场成为了各跨国公司讨论的话题,由于新产品引进具有投资少,技术成熟,无需研发周期,上市