层次聚类中类间距离新定义

来源 :浙江大学理学院 浙江大学 | 被引量 : 0次 | 上传用户:sw440
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文是在攻读硕士学位期间完成的,文章考虑的问题是聚类分析.在可获得的数据量呈现爆炸性增长的背景下,聚类分析作为数据挖掘的一个重要工具也越来越受到人们的重视.文章的创新点在于对层次聚类算法的类间距离提供了一种新的定义方式,即通过将类作为整体,而不是通过类中的样本来考虑类间距离.在具体的实施中,运用了两个思路,一个是提取代表元,另一个是将类中所有样本作为整体进行考虑,并对每个思路提出了相应的定义.最后,通过对实验数据的分析,得出了较为有效的两种定义方式PCAHC和VRHC.文章的结构如下:第一章为引言部分,介绍了数据挖掘和聚类分析的研究现状和发展以及本文的研究内容和创新点.第二章中对聚类分析的一系列问题进行了回顾和总结.第三章对文章中要使用的相关方法进行了简要地介绍.第四章先回顾了已有的类间距离定义,然后利用相关的理论得出了类间距离的几种新定义方式,并简要介绍了相应的算法.第五章利用不同的数据集对第四章中所提出的算法进行了验证,通过比较分析选出了几种有效的定义方式.在结论部分总结了本文所做的工作和有待解决的问题.
其他文献
Zheng于1997年提出了签密的概念。签密能够在一个合理的逻辑步骤内同时完成数字签名和公钥加密两项功能,而其所花费的代价,包括计算时间和消息扩展率两方面都远远低于传统的
本文内容分为两部分,第一部分为本文的第一章,主要讨论了双重退化非线性抛物方程的初始迹的问题.我们证明了当q>m(p-1)或q≤m(p-1),m(p-1)>1时,方程的任意解的初始迹是外部正则的
《Nature》在1999年刊登了两位科学家Lee和Seung对数学中非负矩阵研究的突出成果.该文提出了一种新的矩阵分解思想——非负矩阵分解(Non-negativeMatrix Factorization,NMF)
随着网络技术的快速发展,电子商务和电子政务已经开始普及,大量的文件将以数字图像形式在网上流动,相对于纸质文档,数字化的文档具有易于保存和交流等优点,但是存在安全性低,篡改容
由于Rudin、Osher和Fatemi提出的全变分模型在去噪声的同时很好的兼顾了保留图像的边缘和细节的要求,全变分模型及其推广被广泛的使用在针对各种噪音的降噪,去模糊等图像恢复问