论文部分内容阅读
研究现有的迭代优化聚类的初始化方法:即采样法,距离优化法以及密度估计法,分析它们的优缺点。提出一种新的基于距离的初始化方法,它不需要设定门限,不受数据集的顺序影响,它使得聚类过程有良好的速度和迭代次数,且初始化运算时间较短,对孤立点和噪声有较强的抑制作用,它适用于较大规模数据的聚类初始化。