在核诱导的鲁棒度量下的模糊C-均值与可能性C-均值算法

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:yujiesky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
用核方法来改造传统的学习算法是近年来机器学习领域研究的一个热点.本文提出了一种新的应用核方法在原输入空间中进行聚类的思想,并把其推广应用于传统的聚类算法,得到模糊核C-均值算法和可能性核C-均值算法.该类算法的实质是在准则函数中采用了一类核诱导的非欧氏距离的新的距离度量,并且依据Huber的鲁棒统计分析,该类算法是内在鲁棒的,适合对不完整数据或缺失数据、含噪数据和野值的聚类.最后在人工和Benchmark数据集上对上述算法的性能进行了验证. It is a hot topic in the field of machine learning that using the kernel method to transform the traditional learning algorithm.This paper proposes a new idea of ​​using the kernel method to cluster in the original input space and extends it to the traditional clustering Algorithm to obtain the fuzzy C-means algorithm and the probabilistic C-means algorithm.The essence of this kind of algorithm is to adopt a new type of distance-induced non-Euclidean distance measure in the criterion function, and according to Huber’s Lu This algorithm is inherently robust and suitable for clustering incomplete data, missing data, noisy data and outliers.Finally, the performance of the above algorithm is verified on artificial and Benchmark datasets.
其他文献
电视新闻改革创新是一项艰巨的系统工程,广大电视新闻工作者必须认真思考和面对这一课题,这是摆在我们每一名新闻工作者面前的艰巨任务."三贴近"原则体现了新闻节目的传播规
我国幅员辽阔、河流密布,蕴藏着丰富的水力资源。水电又具有许多突出的优点,加快水电建设,尽早开发利用水力资源,促进工农业生产,改善和提高人民的物质生活条件,有着十分重要
共有445个字,"芝"是其中一个,被释为"神草".虽然只有一个字,但其所承载的内涵却是非常丰富的.本文将从"芝"的含义和种类、"芝"在生活中所扮演的角色两个方面对"芝"字进行解析
随着数字化变电站在电网中的试点运行,电子式电流互感器作为数字化变电站的关键设备逐步挂网运行.电子式电流互感器在技术性能、技术参数、应用配置、检修管理、运行管理等方
早期断奶仔猪应激一直是困扰养猪业的一个难题,也是猪营养研究的重点与发展方向之一.由于幼龄仔猪消化系统和免疫系统都尚未发育成熟,早期断奶不当易造成仔猪胃肠道功能紊乱,
社交恐惧症是人群中较为普遍的现象,调查显示在大学生中社交恐惧症患者达到7%-8%.了解社交恐惧症的危害和调节方法,有利于大学生正确认识自己的社交生活并做出及时的调整,更
水解和吸收是尿素装置必须设置的工序,目前可以选择的方案较多。文章结合“金陵石化”化肥装置拆迁项目中48万t尿素装置技术方案的选择,分析了不同技术方案的优劣,为今后同类
灵芝具有显著的医疗作用外,还具有观赏价值,因为灵芝不仅形态奇特,色彩绚丽,富有光泽,而且长期不朽.本文综述灵芝工艺品的制作技术及观赏价值.
我国新一轮医疗卫生体制改革正在深入推进,在新形势下确立财务管理目标,并分析目前财务管理中存在的问题,进而采取有效的措施,实现财务管理目标,成为医院财务管理中的重要课题。本
研究并制作了一台用于三相四线制配电网的串联混合型滤波器实验样机,采用基波电流控制的策略,可以显著抑制非线性负载产生的谐波电流对电网的影响.实验装置采用以数字信号处