论文部分内容阅读
针对子项集时间序列,本文从理论上提出了一种模式挖掘的数学模型。首先设置实时频率矢量;然后针对每个到达的子项集中的项,计算并更新实时频率矢量中记录的项的平均频率;以模式考察时间阈值为周期,每周期计算当前实时频率矢量和模式集中现有实时频率矢量的皮尔松相关性;如果相关系数大,则说明当前模式已经存在于模式集中;如果相关系数小,则说明当前模式是一个新模式,从而加入模式集。实验中,运用此模型到Web 安全上,对新浪门户网站进行考察和检验,结果表明此模型对于防御Web 异常非常有效。