一种基于非参数贝叶斯模型的聚类算法

来源 :宁波大学学报:理工版 | 被引量 : 0次 | 上传用户:szweixian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
鉴于聚类分析是机器学习和数据挖掘领域的一项重要技术,并且与监督学习不同的是聚类分析中没有类别或标签的指导信息,所以如何选择合适的聚类个数(即模型选择)一直是聚类分析中的难点.由此提出了一种基于Dirichlet过程混合模型的聚类算法,并用collapsed Gibbs采样算法对混合模型的参数进行估计.新算法基于非参数贝叶斯模型的框架,能够在不断的采样过程中优化模型参数并形成合适的聚类个数.在人工合成数据集和真实数据集上的聚类实验结果表明:基于Dirichlet过程混合模型的聚类算法不但能够自动确定聚类个数
其他文献
This article describes an experiment involving an oral English programme conducted over a four-month period with a group of learners of ESL in Huizhou Universit
期刊
从日前召开的苏州高新区全区民营经济工作会议传出信息,今年前七月,全区民营经济快速发展,民营企业进一步做大、做强,项目平均投资规模明显扩大。今年新增注册资金在100万元以上
本文通过对该区铬铁矿的矿床学及硼的地球化学晕特征等方面的详细研究,提出萨尔铬铁矿矿床后期成矿的看法,根据硼异常与矿体之间的密切关系,分析了该矿床后期成矿特征及形成
近3年来,作者应用甜梦胶囊合通塞脉片治疗慢性低血压患者36例,取得较好效果,现报告如下。
Painleve展开法是求解非线性偏微分方程的最有效的方法之一,主要利用Painleve标准截断展开和非标准截断展开法及Maple软件来求得修正的Camassa—Holm(mCH)方程的精确解.
房地产投资与经营,是目前经济活动中的重要内容.分析南京市房地产投资与经营的现状特征、发展趋势和存在的主要问题,指导企业的投资与经营策略,提高房地产业的运作效益,对促
【原文】范子谦名大捷,鄞诸生,性仁孝……好周人之急,唯恐不及,兼精于医……后遂以医名郡中。其出疗人疾,尝先往部族及贫家,而后及舟车之迎者。里中有贫妇,将娩,忽惠痘甚危,子谦自携药
期刊
遗传积分形式与弹性元件和粘壶串并联表示的微分形式可以描述高聚物小变形情况下的粘弹性特性.文章以这些小变形的本构模型为起点,推出有限变形下的本构模型.一个有限变形过程分