论文部分内容阅读
频繁模式挖掘是数据库挖掘中的一个十分重要的组成部分 ,然而以前的许多研究都是基于Apriori的产生候选集的测试迭代方法。这些方法普遍存在需要多次扫描数据库 ,对产生的大量候选集进行迭代测试的缺陷 ,尤其是对于挖掘长模式时这种缺陷就尤为突出。FP growth方法采用分而治之的策略 ,只需对数据库进行二次扫描 ,而且避免了产生大量候选集的问题。文中的基于SQL的频繁模式挖掘方法既是在此基础上提出的 ,采用子查询及DBMS扩展技术 (如用户定义函数等 )对该方法进行了改进。