基于混合高斯模型的聚类分析

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:super_mouse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据聚类是静态数据分析的一门技术,在机器学习、数据挖掘、模式识别、图像分析以及生物信息等领域受到广泛应用。由于数据统计分布的随机性和复杂性,数据的概率分布往往比较复杂,但是该数据的概率分布总可以采用混合的高斯模型来任意地逼近,本文就研究了混合高斯模型的聚类分析方法。本文研究了两类混合高斯模型。第一类是有限混合高斯模型,基于该模型的聚类提供了一种概率性的方法。为估计有限混合高斯模型的参数值,通常采用EM算法,该算法不需要先验知识,可以实现该模型结构和参数的自动学习,但是其不足之处在于它对初始的聚类中心比较敏感。这篇文章采用三种不同的初始化方法来验证EM算法受初始值的影响。为了克服EM算法对初始值敏感这一缺陷,本文又研究了结合惩罚似然函数法的修正的EM算法。直观地讲,如果一些混合权重或混合概率收敛到零,相应的组件将要被甄灭且合适的混合组件将被保留。该方法的好处在于当我们处理多维的混合高斯模型时,事先不需要假设不同的组件有相同的协方差矩阵。与EM算法聚类结果进行比较,实验分析的结果表明修正的EM算法聚类效果更好。另一类为无穷混合高斯模型。由于有限混合高斯模型进行高维数据聚类分析时,需要预先估计聚类个数,因而聚类的准确性和泛化性受到影响。基于此本文又研究了基于无穷混合高斯模型的聚类,其核心是以Dirichlet过程作为混合权重的先验对高维数据开展聚类分析,好处在于模型中的聚类数可以自动的计算得出,不需独立的确定,具有较强的灵活性和鲁棒性,能够更加准确地拟合数据本身。
其他文献
  本文将利用Iwaniec筛法在代数数域和函数域两种情况下考虑最小原根的估计,介绍原根的定义及最小正原根估计方面的已有结果,并简述本文所使用的方法;引入Grossen-特征及Hecke
初中语文学习有承上启下的作用,即它既承接了小学学习简单的语文知识,同时也为高中深入了解语文知识奠定了基础.因此,一定要重视初中语文的教学,它不但可以使学生学到更多的
  本文研究余维3的三维系统Xμ(x),含有两个鞍-焦点O1和O2,有一条连接这两个平衡点的非粗糙异宿轨线Γ0,另外,关于平衡点O1有两维稳定流形Ws(O1),O2点有两维中心流形Wc(O2)且O2
本论文对图论的Minor问题和路因子问题进行了研究.如果图H能通过图G去边,去点和收缩边得到,则称H是G的minor.不包含minor定理刻画了不包含某些给定图作为minor的图的结构.本文
三江侗族自治县县委组织部针对机关、事业、企业及基层党组织收缴党费存在的问题,去年起在全县基层党组织推行“党员欠(少)交党费告诉制”。县委组织部要求各基层党委每个季
这篇文章考虑的是索赔具有时间相关性的复合二项式风险模型的一些问题.假设每一个主索赔发生的时候可以产生一个子索赔,并且子索赔可以同时或者延迟发生.在文中给出这个风险模
  本文在单个元件δ-冲击模型的基础上,分析了n个δ-冲击模型元件组成的复杂系统. 首先,运用“将一般复杂系统转化为并联系统的线性组合”的思想给出了一般复杂系统δ-冲
1975年,DavidE.Radford在域k上构造了两类有限维点Hopf代数.1999年,他又继续研究了“单点Hopf代数”的结构和性质,并且给出了一个有用的引理使得我们可以判定有限维点Hopf代数是
  本文对互连网络拓扑结构分析中的问题进行了研究。文章介绍一些图论以及互连网络理论的基础知识;论述了强乘积图的一些基本性质和强乘积图的连通度和强乘积是构图方法及强
本文主要将遗传挠理论同拉回环结合,讨论由拉回环确定的模范畴及由拉回环确定的挠理论.为方便后面各节的应用,我们介绍了一些遗传挠理论的基本概念与性质以及拉回相关的一些性