论文部分内容阅读
DBSCAN是基于密度的聚类算法的一个典型代表。但是DBSCAN算法在处理大规模数据库时,存在很大欠缺。PQR*TDBSCAN是针对DBSCAN算法内存使用过大、I/O消耗过多等方面提出的,但是在实际应用中发现存在异常挂死的可能。本文针对PQR*TDBSCAN的缺陷进行了改进。测试表明,本算法在处理海量数据过程中降低了DBSCAN对时间和空间的需求。