论文部分内容阅读
在进行聚类分析的时候,许多算法需要事先给出聚类类别数目。如果在不了解原始数据内部结构的情况下,很难给出合适的聚类类别数目。因此,通过对目前的聚类算法的研究,提出了一种聚类类别数目自动学习算法。算法在分析原始数据的内在分布的基础上,通过统计分布测试,能够准确的判断数据分裂的合理性,最终得到能充分拟合原始数据的聚类类别数目。实验证明算法是可行并且是有效的。