论文部分内容阅读
本文以标记有序树作为半结构化数据的数据模型,研究了半结构化数据的树状最大频繁模式挖掘问题.已有挖掘算法通常挖掘所有频繁模式,其中很多模式为其它模式的子模式,针对该问题,设计实现了一种最大模式挖掘算法.该算法采用最右扩展枚举方法无重复枚举所有候选模式,利用频繁模式扩展森林实现高效剪枝扩展和挖掘频繁叶模式,通过计算频繁叶模式间的包含关系挖掘树状最大频繁模式.试验结果表明该算法具有良好性能.