论文部分内容阅读
随着互联网的广泛应用,互联网上出现了大量的垃圾信息以及各种网络攻击。要想营造一个健康和安全的网络环境,一个重要的手段就是对互联网信息进行分析过滤。过滤垃圾信息和入侵检测采用经典的多模匹配算法,但是多模式匹配问题又会给我们带来一个问题,就是算法要以牺牲空间来换取时间,普通的服务器可能无法给分析系统提供足够的内存。本文提出了利用多台机器来解决处理大规模模式时单台服务器无法工作的问题。首先,本论文介绍了AC算法和WM算法的原理。AC算法利用了模式串之间的相同前缀关系,每次失配时要近可能的跳转更远的距离。WM算法引入了坏字符跳转的思想,采用了HASH散列的技术来提高匹配的效率。另外,设计AC和WM算法的接口,如数据传输接口、查询接口等,把AC和WM算法运用到多机系统中去。其次,论文提出了基于多机系统下模式串集的分割算法。在基于多机的系统中,设计通信的协议和调用AC和WM算法的接口。设计基于多机的系统下模式串集的分割算法,模式集分割算法是过滤系统设计中的重要部分。分割算法影响整个系统内存的分配,又会影响系统的响应时间。最后,论文给出了系统的功能和性能测试结果。对于功能测试,测试包括系统分割模式集功能、系统的查询功能,从而验证了系统功能的正确性;对于性能测试,测试本多机系统下和单台服务器下的查询时间。