聚类方法及应用研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:xcumuhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类方法是一种无监督的学习方法,它在统计决策、数据挖掘等领域中都有广泛的应用.聚类的体系十分庞大,其类别、算法非常多.目前研究者们提出的聚类方法都有其自身的优缺点及其特定的适用数据范围.对相同的数据集,若采用不同的聚类方法,常得到不同的聚类结果.为了人们在实际应用中能更快捷地找到最好的聚类算法以解决其实际问题,本文对聚类方法及代表算法进行了综合分析,并对各种聚类方法的特点进行了评注. 本文对三种著名的聚类算法:k-means算法、COBWEB算法、DENCLUE算法进行了对比分析,为了得到较为客观的对比结果,本文在三种不同的数据集上进行了实验,即有重叠的数据分布,有交叉的数据分布和多类高维UCI数据集,最后对实验结果进行了分析,分析了各种方法在不同数据分布中所得实验结果的原因.
其他文献
学位
人们在对大量的数据进行分析的过程中经常发现一些异常的观测值,这些观测值可能蕴含着大量有用的信息。因此,异常点的探测和分析是一个有趣而重要的数据挖掘任务。 异常点在
本文从模糊子群及其分解定理与表现定理出发,介绍了模糊理想的定义和基本性质,并在此基础上,进一步提出了反模糊理想的概念,详细论证了反模糊理想的两个重要的性质:存在性和唯一性
设G=(V, E)为n个点的三连通图,令X?V(G).C为G中的圈,如果对于G中任意的圈C’都有|X ∩ V(C)|≥|X ∩ V(C)|,则称圈C为X-最长圈.我们用α(G)表示图G的独立数,α(X)表示G[X]的独立数.
本文主要利用族的理论研究拓扑动力系统的混沌性态.具体来说,在第一章中,简单介绍了拓扑动力系统的内容、方法、发展历程、研究现状和本文的主要研究内容. 在第二章中,主要讨论