属性权重的Lead er聚类算法

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:lhcming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  Leader算法是一种基于粗糙集的层次聚类算法,无需预先指定簇的个数且对孤立点具有鲁棒性,算法思想简单、快速。但该算法也存在一些弊端:对样本采取硬划分、聚类结果依赖样本顺序、聚类分析中未考虑属性权重的影响等。本文研究内容主要针对Leade r算法存在的属性权重问题展开,文中首先介绍了聚类算法的一些基本知识,接着介绍了一种针对Leader算法存在的硬划分问题提出的改进粗糙Leader聚类算法(RLeader),该算法同时解决了Leader算法存在的样本顺序问题等。   针对Leader算法和RLeader算法对每一维属性赋予相同的属性权重,未考虑聚类过程中各维属性贡献程度不同的问题,提出了负投影梯度法最小化属性权重目标函数法(MWOF-NGP)和梯度下降法最小化属性权重目标函数法(MWOF-GD)学习数据集的属性权重。将所得属性权值分别应用到Leade r算法和RLeader算法中,构建了两种基于属性权重Leader聚类算法(NGP-WLeader和GD-WLeader)和两种基于属性权重的粗糙Leader聚类算法(NGP-WRLeader和GD-WRLeader)。   本文在UCI的多个数据集上比较了Leader、NGP-WLeader和GD-WLeader的聚类结果,以及RLeader、NGP-WRLeader和GD-WRLeader的聚类效果,其中聚类结果用“熵”和“精度”评价。实验结果表明:NGP-WLeader 算法比 Leader 算法的聚类效果好;GD-WLea der算法的聚类结果中除极个别情况外,整体上也优于Leader算法的聚类结果;NGP-WRLeader和GD-WRLeader的聚类效果均优于RLeader算法。即基于属性权重的聚类算法比传统聚类算法的聚类效果好,这是由于基于属性权重的聚类算法通过强化重要属性和消减冗余属性在聚类过程中的作用,改善了聚类效果。此外,由于梯度下降法容易陷入局部最优,而负投影梯度法没有该缺点,因此,从整体而言,基于负投影梯度法的属性权重聚类算法比基于梯度下降法的属性权重聚类算法的聚类效果好,即NGP-WLeader比GD-WLeader的聚类效果好,NGP-WRLeader比GD-WRLeader的聚类效果好,聚类结果验证了MWOF-NGP算法比MWOF-GD算法具有更好的属性权重学习效果。
其他文献
  在信息化不断发展的时代,各企事业单位越来越依赖信息的沟通和数据的处理,信息系统支撑着它们的日常业务与工作,并逐渐成为运行的核心。在铁路车站中,随着作业信息化的加
  随着人们生活水平的不断提高以及计算机技术的快速发展,人们对图像与视频的使用要求越来越高,运用抠图技术,可以减少大量的拍摄费用,也可产生超现实的视觉效果。随着研究的深
  信息化时代的到来使信息量爆炸式增长,产生了针对海量数据集的知识发现理论(knowledge Discovery in Database,KDD),基于粗糙集的属性约简就是其中的重要内容。它尽可能
图像局部不变特征提取是计算机视觉领域中的一个基本问题。局部不变特征提取大致分成两个步骤:首先利用局部不变特征检测方法在图像上检测特征点位置、尺度等相关信息,然后根
医疗影像为医生诊断疾病提供了重要的依据,并且随着时间的积累和医疗影像设备种类和数目的日益增多,医院已经积累了大量的医疗影像数据。医疗影像数据种类多,数据格式差异性
随着Web2.0技术的发展,互联网在人们生活中扮演着越来越重要的角色,电子商务的普及和完善大大改变了人们的生活习惯。然而由于网络的飞速发展导致了信息量的膨胀,如何给用户
随着互联网的发展,当今社会早已成为信息化社会,人们对网络上的服务器也提出了更高的要求。传统服务器受内存、CPU和磁盘I/O等的限制,即使经过硬件升级也很难适应当前的需要
智能视频处理目前在“智能交通”、“智慧家居”等方面有了普遍应用,通过对视频监控进行分析,能够有效的进行交通管理,保证广大人民的财产安全。车流量检测是智能视频分析领
  随着计算机技术的飞速发展及其在各个领域的深入应用,不论从国家安全还是经济发展的角度出发,计算机软、硬件系统的自主研发都越来越受到重视。在硬件系统方面,我国已成功研
  随着软件产业的迅速发展,为了保证软件的质量,软件开发人员需要快速、准确地获取各种缺陷信息,及时发现并修改缺陷。软件度量数据是需要获取的重要软件预测信息之一,且它是典