论文部分内容阅读
通过建立基于分组俘获文件产生网络流的模拟环境,对计数型算法和略图算法两类经典的频繁项挖掘算法的适用性进行验证,检验采用界标窗口查询模式的效果。实验结果表明,算法查全率不低于98%,与查准率和查询精度的相关性弱,与数据项的规模及数据流中频繁项分布的相关性强。略图类算法对频率的估算误差比较稳定,计数型算法则偏大。计数型算法的执行效率明显优于略图类算法。