面向邮件安全网关的高性能匹配技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:songlove511
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
邮件安全网关产品在过滤垃圾邮件、拦截敏感信息和防止核心文件泄漏等方面发挥了至关重要的作用。随着互联网用户的爆炸式增长,对邮件安全网关的处理性能的要求越来越高。将邮件安全网关分解后看,零拷贝和DPDK等高性能收发包技术的出现使得底层对数据包的处理效率有了很大的提高,但是在协议解析和关键字匹配方面的发展并不能与之相适应,而其中尤以匹配技术最为重要。本文从提高邮件安全网关的匹配效率的角度出发,从邮件地址匹配和邮件正文匹配两个方面展开深入研究。在邮件地址匹配方面,邮件地址的长度基本固定在一个范围内,邮件地址过滤是在一个邮件地址集合中查找某个邮件地址是否在集合中。计数布鲁姆过滤器在此类场合中的应用比较广泛,但是计数布鲁姆过滤器的空间复杂度较高,而且假阳率也比较高。为了降低计数布鲁姆过滤器的假阳率并且最大程度上降低空间消耗,本文提出了一种基于指纹的可变长计数布鲁姆过滤器fingerprint variable length counting bloom filter(FPVLCBF),将指纹的思想与可变长计数布鲁姆过滤器相结合。并将其与现存的几种计数布鲁姆过滤器改进型方案相对比,证明了FPVLCBF是一种低假阳率,拥有较低的空间复杂度和时间复杂度的计数布鲁姆过滤器,非常适合用在大流量环境下的邮件地址匹配中。在邮件正文匹配方面,邮件正文中通常会含有Base64编码文本,所以需要对Base64编码文本进行匹配。传统的Base64编码文本匹配方式是先对其进行解码,再对解码后的内容进行匹配。本文对一种Base64编码文本直接匹配算法进行了深入的研究,并在字符集为一些字符个数较少的特定字符集的情况下,对其进行了改进,采用哈希表存储首尾字节组Base64编码块的方法省去了模糊匹配之后的解码操作。实验结果表明改进后的EmailMatch算法与EmailMatch算法相比拥有更高的匹配效率。最后本文在前两种技术的基础上实现了一款高性能邮件安全网关系统。并对系统的实现目标、网络拓扑、模块组成进行了介绍,对系统进行了功能验证和性能测试。验证结果表明本邮件安全网关系统非常适合工作在大流量的网络环境中。
其他文献
生石灰掺入过湿土路基后,其干湿材料的相互混合作用、生石灰的水化吸水作用以及与土拌和过程中引起水份蒸发作用降低了土的含水量。但当路基成型后,路基外部环境湿度增长会导
土壤侵蚀被称为“蠕动的灾难”,是当今社会人类面临的持续性最强的自然灾害,是人们最关注的生态环境问题,闽西宁化县是我国南方丘陵地区水力侵蚀的典型代表之一。本文以宁化
机会网络是一种不需要从源节点到目标节点之间存在完整链路,利用节点移动带来的相遇机会实现通信的自组织网络。由于机会网络中节点是由人类所携带的短距离智能通信设备组成,
目前,在国家审计领域,广大的审计人员的审计方式逐渐由纸质材料审计转向使用计算机进行审计,计算机在审计领域中逐渐显露出其强大的数据分析功效,国家审计署以及各地方审计单
全面建成多层次社会保障体系是党的十九大报告提出的明确目标,医疗保障作为社会保障体系中的一个分支,对民众享有基本医疗保障权利发挥着关键作用。其中“完善统一的城乡居民基本医疗保险制度”更是解决广大非就业人群“病有所医”问题的重点和突破口。城乡居民基本医疗保险制度整合是陕西省基本医疗保险制度体系建设最主要的结构性变革。受长期城乡“二元”结构影响,城镇居民医保和新农合在制度设计上有着诸多问题,使得公民无法
生物炭是一种稳定的富碳产物,通过农林废弃物等生物质在缺氧条件下热裂解形成。在我国北方地区,玉米和小麦作为最经常使用的粮食作物,其秸秆便成为了主要的农业废弃物。这些
借壳上市在我国的发展历史并不算长,却是A股上市公司并购重组最为重要的交易类型之一,广受资本市场各个参与主体的关注。近几年,随着上市公司并购重组交易的迅猛发展,借壳上
随着科学理论的进步与信息技术的发展,经典通信过程中信息安全逐步受到来自窃听者的威胁。量子通信基于量子力学原理可以使得用户之间实现远距离无条件安全的通信过程。量子
南方花岗岩红壤区水土流失严重,通过造林种植了大面积的马尾松,但是林分结构单一缺少其他植被的覆盖,马尾松林地水土流失依然严重。长汀县是马尾松林地水土流失最严重的县份
近年来,随着互联网技术的的高速发展和广泛应用,人类活动的每时每刻都会有大量的数据产生并进入计算机系统,我们将这些数据进行存储、分析和挖掘,并基于这些数据来提供各种多