基于核函数参数优化的FCM聚类算法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:gyl5667661
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是用数学的方法研究分类问题的一门学科,近20年来得到了迅猛的发展,并在模式识别、计算机视觉、决策分析以及预测等领域中获得了广泛的应用。模糊聚类由于能够描述样本类属的中介性,能够客观地反映现实世界,已逐渐成为聚类分析的主流。在众多的模糊聚类算法中,模糊c-均值算法(FCM)可以说是应用最为广泛、最为灵敏的一种算法。但它没有对样本特征进行优化,其有效性很大程度上取决于数据点的分布情况,对初始化特别敏感,很容易陷入局部极小值或者鞍点,而得不到全局最优解。并且当使用这一聚类算法时,必须事先指定数据集的聚类数,然而聚类数c一般是很难预先知道的。当样本边界为线性不可分或者样本中有离群点时,聚类效果较差,无法达到高精度的聚类要求。而核函数的引入增加了对样本特征的优化,通过将样本点从输入空间映射到高维特征空间,将非线性学习问题转化为线性学习问题,从而实现了更为准确的聚类。  本文将核方法的思想推广到模糊c-均值聚类算法,提出了两种核聚类算法,包括特征空间中的模糊核聚类算法KFCM和输入空间中的模糊核聚类算法KFCM。在人工和Benchmark数据集上的结果显示,所提出的核聚类算法是鲁棒的,适合对不完整或缺失数据、包含噪声和离群数据的聚类。  对于样本集中含有离群点的数据,提出了一种新的特征加权模糊核聚类算法来发现样本集中的离群点。通过Mercer核把离群点映射到特征空间,并为特征空间的每个向量分配一个动态权值,在经典的FCM模糊聚类算法的基础上得到了一个特征空间内的全新聚类目标函数,通过目标函数的优化,最终得到了各个数据的权值,根据权值的大小标识出样本集中的离群点,并且,也从理论上证明了特征加权模糊核聚类算法的收敛性。
其他文献
近日,邢台国泰发电公司两台30万千瓦脱硝改造工程炉脱硝钢架已吊装至最高柱节点40.6米,27.9米层平台已开始铺设,出口段烟道吊装就位,下方同步布置安全平网,脱硝反应器配制工作完成
期刊
本文所研究的混合整数线性模型来源于GPS定位技术的数据处理,而其中整周模糊度的估计是GPS高精度定位中的一个关键。其模型为:Y= AX+Bθ+e,e~N(0,Qy)其中Y表示观测量;X表示未知基线向
改革开放的中国用了30年的时间“跑”过了OECD国家100多年两次产业革命的大部分历程。但一直到今天还坚持“以煤为主”的能源战略,沿袭传统能源利用模式。尽管以“自力更生”
期刊
本文针对小班制管理两个班成绩不平衡和班主任能力存在差异的实际问题,通过两届大班制管理下班主任的工作实践,充分分析大班制管理存在的问题和优势所在,提出了适合大班制管理的
本文主要研究非线性系统中的一些时空动力学与合作行为,分为连续系统和离散系统两个部分. 在第一部分中,我们研究时间连续、空间分立的接触振子系统的一些动力学行为.以 Jos
材料工程专业是一项实践性较强的学科课程,其中的实践教学主要指的是对于学生的操作能力以及思维创造能力的培养具有重要的现实意义。本文对现有的教学体系以及教学内容进行详
延迟积分微分方程广泛出现于物理、工程、生物、医学、航天航空及经济等领域,其算法理论研究具有毋庸置疑的重要性,近年来逐渐引起众多学者的极大关注.中立型延迟积分微分方程
Visual tracking, as a popular computer vision technique, has a wide range of applications, such as camera pose estimation. Conventional methods for it are mostl
语文阅读学习应该引领学生走进其中,去解读,去品味,去领悟,去熏陶,应该让学生在阅读学习的过程中体验到学习的乐趣,然后终身学习,体会学习的快乐,营造良好的学习氛围,让学生充分感受阅
英语是我们初中阶段的一门课程,有些学生可能觉得只要课上认真听讲,课后完成作业就好了,岂不知英语它更是一门语言,它具有工具性更具有人文性,学习英语我们能走向世界更能让世界了