论文部分内容阅读
针对传统的DBSCAN算法只能依靠经验来设置阈值(minPts,Eps)和无法对多密度数据集进行有效聚类的不足,提出了一种可适用于所有密度分布特征的数据集的基于高斯分布的自适应DBSCAN算法.该算法根据数据集的特点寻找最大的聚类效果指数(CEI)来确定minPts,通过Distk图的层次数确定Eps个数并通过高斯分布中的参数估计来确定每个密度层次Eps大小,最后用所求得阈值进行聚类.将该算法与传统的DBSCAN算法分别应用于单密度数据集和多密度数据集,结果显示该算法更有效.