论文部分内容阅读
在数据量很大时,原有的数据分类方法变得失效.因此提出一种新的基于抽样的数据分类算法PSS,并提出三种PSS并行化算法AS,HS和VS算法.在相同的数据量下,PSS算法比传统的SPRINT算法具有更好的性能.实验结果表明,PSS算法及其并行化算法是一种高效的数据分类算法,尤其适用于解决海量数据库中的数据分类问题.