论文部分内容阅读
经过40余年的发展,字符串匹配已经从单一的单模式串匹配发展成为包含多模式匹配、正则匹配、近似匹配等多个新方向的研究领域。而随着计算机技术、网络技术的发展,社会的进步,字符串匹配也有了越来越广泛的应用场所。在信息检索、入侵检测、网络数据分析等多个领域都能够看到字符串匹配的身影。布尔表达式匹配也有很多的应用,如搜索引擎中的布尔查询,病毒检测系统的特征组合匹配等等。字符串匹配算法以往的研究和实验分析都是在模式集规模在几千到几万的情况下进行的,对于大规模模式集下的算法没有进行过深入的分析。本文主要研究内容分为如下两个部分:研究在大规模模式集下的多模式匹配问题的特点和难点,提出了基于Wu-manber算法的三种改进算法:基于最短关键字长度哈希的改进算法、多哈希值预检改进算法、成组比较改进算法。研究布尔表达式匹配问题,提出更泛化的复杂与或布尔表达式匹配问题,并且针对该问题提出扩展位标记算法。此外本文还提出了布尔表达式化简方法,来进一步减少表达式数目,提高匹配效率。综上所述,本文在研究和总结现有的模式匹配算法和布尔表达式匹配算法的基础上,重点对大规模模式集下匹配算法、复杂与或布尔表达式匹配和表达式化简进行研究,提出优化方案,并且通过实验来验证算法的可行性以及空间和时间效率。最后本文还展望了该领域的未来发展趋势。