论文部分内容阅读
有限混合模型聚类是非常重要的一种结合参数和非参数的聚类模型,指数型分布族是概率中最常见的一种分布族,通过数据聚类,可以从杂乱无章的数据里提取出非常重要的有一定规律的信息,利用这些信息,可以指导我们的工作和学习,改善我们的实践方法。 本文结合贝叶斯后验概率给出了指数型分布族有限混合聚类模型的一般表达式.本文利用EM算法估计参数满足的表达式,利用Newton迭代法和Monte Carlo求解参数,利用BIC准则确定指数型有限混合模型的分布的具体个数,然后在拟合阶段以指数型分布族中的gamma分布为例,利用参数不同的数个gamma分布模型拟合观测数据利用贝叶斯最大后验概率给出了数据分类,计算结果表明,该方法能够较好的学习混合gamma分布模型的聚类,除此之外,为了提高模型的精度,本文还引进了机器学习方法中的集成学习方法,给出了关于指数型有限混合模型的的集成聚类模型。