论文部分内容阅读
运用抽样和动态项集计数的思想,提出了一个仅对数据库进行一遍扫描的关联规则挖掘算法DS.DS首先在数据库上随机得到一个样本集,然后在样本集上使用动态项集计数方法得到数据库的估计频繁项,之后通过对数据库中的非样本事务进行一遍扫描得到这些项的实际计数,进而得到数据库的频繁项集.实验证明,DS算法极大地提高了挖掘的效率.