半监督模糊聚类集成方法研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:w33333333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是数据挖掘领域的一个重要性工具,它根据某种相似性准则将数据对象划分成若干个簇,以发现数据对象内在的分布情况。尽管目前学者提出了许多聚类算法及改进算法,但任何单一聚类算法都无法准确揭示各种数据集所呈现出的簇结构;面对具有各种形状或结构的数据集,寻找符合该数据集的单个聚类算法变得更加困难。聚类集成将不同的聚类算法或同种算法通过使用不同初始参数得到的结果进行合并,以获得比单个聚类算法更加优秀的结果。然而,多数情况下的聚类集成算法是建立在非监督方式之上的聚类集成算法,由于缺乏对先验知识的利用,致使聚类集成的准确性受到影响。考虑将半监督学习与聚类集成方法相结合,可以进一步提高学习性能。传统的聚类集成算法大部分是建立在硬聚类的基础上的,但在现实生活中大多数样本具有模糊性,从聚类集成的一开始便使用硬聚类算法将可能会导致部分有用信息的丢失;同时在聚类集成的过程中,由于基聚类结果的产生也伴随着潜在信息的产生,潜在信息的获取会较好的提高聚类集成的性能和质量。然而多数的聚类集成方法忽视了潜在信息或者潜在信息的获取方式较为复杂,导致聚类集成的结果受到影响。针对此问题,本文提出一种基于链接的模糊聚类集成方法,将数据与簇之间的相关性矩阵转化为表示数据相关性的权重图,通过简洁而有效的方法获取了潜在信息,并利用图划分算法提升最终结果。在半监督聚类集成的研究方面,在集成过程中加入成对约束信息时,不仅考虑约束点与被约束点之间的关系,而且考虑了约束点与被约束点邻域点之间的关系。给出了基于半径和使用高斯分布选取邻域点的两种方式。将数据本身的相关信息与半监督知识相结合,在半监督信息的基础上对先验知识进行扩充,并将扩充后的半监督信息用来指导集成过程,获得了较为理想的实验结果。
其他文献
声学多普勒海流流速测量技术在防洪预报、水资源管理和国防等领域具有广阔的应用前景。本文分析了声学多普勒流速测量系统的原理,包括声信号的多普勒效应、发射脉冲的选择及
动态信道分配(DCA)是TD-SCDMA系统的关键技术之一,能够限制干扰、最小化信道重用距离,从而高效率地利用有限的无线资源,提高系统容量。采用动态信道分配是TDD系统的优势所在
在许多研究领域,图像的细节分析很重要,而分辨率越高的图像,包含的细节就越丰富,所以超分辨率重建已然发展为图像视觉领域的一个研究热点。目前文档图像的重建工作在某些场合有很
4G移动通信技术于近几年快速成熟和普及,其链路质量和网络带宽能够媲美于专线,从而促使各行业的无线业务迅猛发展。此处的无线业务指利用移动通信技术完成无线终端的接入,使
随着高速铁路的不断发展与大规模建设,列车运行速度不断提高,网络数据通信量急剧增加,对铁路信息传输的可靠性以及网络灵活性的要求也在提高。传统网络架构采用分布式协议来管理
视频编解码以其贴近人们日常生活而成为众多学者研究的目标,H.264/AVC标准代表了国际编解码标准的最新技术和更优越的性能。我国也在2006年推出了首个具有自主知识产权的标准.AV
随着嵌入式系统和网络信息技术的飞速发展,嵌入式应用与网络的结合越来越紧密,嵌入式Web系统以其独特的优势广泛地应用到各个领域。其中,使用嵌入式Web服务器远程控制信号设
园林绿化是城市建设最为重视的部分之一,它既能提高人们的生活质量及水平,也能改变城市的生态环境。另外,好的园林绿化施工质量可以增强园林的整体功能。本文主要以天津市绿化工
期刊
期刊