半监督聚类算法及其应用研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:guosuzhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是一门非常重要的技术。所谓聚类就是按照某种度量(相似性度量、不相似性度量或距离),根据一定的准则将个体集合分成若干类,使得同类个体之间的相似程度大于不同类个体之间的相似程度即做到”物以类聚”。半监督聚类算法研究无监督学习中如何利用少量的监督信息来提高聚类性能,目前正得到不断应用。本文首先介绍了聚类的发展概况和聚类过程中的相关技术,重点介绍了距离度量、常用聚类方法以及评价准则等等,为后续章节的研究提供了理论和实验基础。针对前人提出的半监督模糊C均值聚类算法,本文对其进行了详细介绍并用实验来证明了该算法。其次,为了验证该种半监督学习方法是否可以用于其它聚类算法,本文对极大熵算法进行了改进,将半监督距离学习引入极大熵聚类,生成半监督极大熵聚类算法,并通过实验证明极大熵聚类算法通过半监督方法改进之后确实有效。对于团状、每类样本数相差较大的数据集,FCM算法与半监督模糊C均值聚类算法的最优解可能都不是对数据集的正确划分,因为这两种算法对数据集有等划分趋势。针对这个问题,最后本文利用样本点分布密度大小作为权值,结合前面的半监督学习方法,提出了半监督点密度加权模糊C均值聚类算法,并通过实验证明了该算法确实能提高聚类精度。
其他文献
随着机器人技术的不断发展,服务机器人的应用领域越来越广泛,除了工业、农业等传统领域外,其在医疗、文娱、家居等诸多环境中得到了广泛应用;同时人们对生活质量的要求不断提
随着互联网的普及和宽带技术的发展,以P2P对等网络技术为核心的软件产品正在为越来越多的网民所接受和喜爱。自2000年开始,国内外多家P2P软件产品产品纷纷问世,其中以国外Nap
数据挖掘技术是近年来数据库和人工智能等领域研究的热点课题,它引起了科学界和产业界的广泛关注。数据挖掘的主要目的是从数据集合中发现隐含的、事先未知的、对决策有潜在
蚁群算法是一种最新发展的模拟昆虫王国中蚂蚁群体觅食行为的仿生优化算法,该算法采用了正反馈并行自催化机制,具有较强的鲁棒性、优良的分布式计算机制、易于与其它方法结合
随着社会信息化的不断深入,对网络带宽的要求与日俱增,而目前广泛使用的接入网技术如数字用户线路(xDSL,Digital Subscriber Line)、电缆调制解调器(CM,Cable Mode)的带宽已无法
人脸是人类最具表达能力的部分,其复杂的特征组成造成人脸建模一直是计算机图形学领域中一个极具挑战性的课题。基于颅骨的三维人脸建模技术是三维人脸建模技术的分支,主要应
随着语义Web和Linked Data运动的发展,语义数据规模变得越来越庞大、涉及的领域也越来越宽广,并且有的数据集已经出现多个版本的演变,这就使得大规模语义数据的分析和存储面
随着通信行业和计算机互联网的飞速发展,电子商务的活动范围不断扩大,电子支付系统成为近年来的研究热点。目前,市场已呈现多种支付方式,但大部分是基于互联网的实现方式或需银行
计算机图形学中,三维标量场一直是可视化研究的重要应用领域,面对标量场中庞大的数据集,无论是科学研究还是经济需要,特征可视化都成为一个活跃的研究方向,三维标量场的拓扑分析方
视频监控中运动目标的检测与跟踪是计算机视觉和图像编码领域的重要研究项目之一,在军事、医学和科研等领域都有广泛的应用。运动目标检测与跟踪算法的设计直接影响跟踪效果