【摘 要】
:
随着互联网的迅速普及,网络内容“垃圾”已经开始侵入我们的生活。为了防止和控制非法,有害信息进行传播,对网络上传播的信息进行内容过滤已成为目前网络安全研究的重点问题
论文部分内容阅读
随着互联网的迅速普及,网络内容“垃圾”已经开始侵入我们的生活。为了防止和控制非法,有害信息进行传播,对网络上传播的信息进行内容过滤已成为目前网络安全研究的重点问题。 内容过滤的核心技术是搜索引擎的字符串匹配算法,经典字符串匹配算法——BM算法,采用了启发式跳跃,但是偏移函数Goodsuffix实现复杂,影响匹配效率。BMH算法在BM算法基础上进行了简化,只使用简单的偏移函数Badchar来计算右移量,使得算法更加简单、快速;BMHS算法在BMH算法的基础上又提出用每次比较中文本串最右端的下一个字符在模式串中的位置来决定右移量,使最大位移由m增大到m+1,匹配速度加快,但在某些情况下,它的效果不如BMH算法。 本文介绍了内容安全的现状,研究内容和发展方向。在深入探讨经典字符串匹配算法的基础上,提出了一种新的、快速的字符串匹配算法——BMG算法。该算法结合了BMH算法和BMHS算法的优点,同时考虑了文本串下一个字符的唯一性,大大提高了最大位移m+1的出现概率,因此有效地加快了匹配速度。 在分析Netfilter防火墙框架的基础上,本文设计了内容过滤模块,实现了内容过滤功能,并分别用BM、BMG算法作为内容过滤匹配算法,在同样的网络环境下,测试这两种算法的时间性能。实验表明,BMG算法比BM算法在匹配效率上占有很大优势,明显加快了防火墙检测非法关键字的速度。
其他文献
东软信息学院是一家主要从事信息技术领域学历教育、培训教育、在线大学教育的教育服务提供者。随着技术进步和社会发展的需求,学院的教学计划调整非常频繁。教学计划的调整要
基因表达谱数据分析需要统计学、模式识别、人工智能、计算机和生物科学等方面的知识。基因表达谱的出现为以上学科在理论和应用上的发展提出了新的挑战。复杂疾病分类,差异表
电子商务到现在为止已经走过了近半个世纪。网络经济的第二浪潮也正在身边风起云涌。在浪花过处,人们逐渐认识到:商务仍是这一切活动的中心,客户服务则是商业成功的关键所在
随着网络的飞速发展,可扩展标记语言(eXtensible Markup Language,XML)以其自身的优点,迅速成为数据表示和数据交换的标准并得到广泛的应用。目前,如何利用使用广泛、数据处
4R-树索引是当前较为实用的双时态索引技术,它由R1、R2、R3和R4四棵相互独立的R-树构成。4R-树索引能够有效地处理时间变元Now和UC,且可在任何支持R-树的数据库管理系统上使用
入侵检测是用来检测和识别对计算机系统和网络系统,或者更广泛意义上的信息系统的非法攻击,或者违反安全策略事件的过程。它从计算机系统或网络环境中采集数据,分析数据,发现可疑
通过建设综合决策支持系统对社会保险管理信息系统产生的大量数据资产进行管理和智能分析,向业务决策人员提供基于知识的决策支持,已成为我国社会险信息化建设进一步发展的重要
加入WTO后,我国汽车业面临的不仅是国外汽车产品带来的冲击,更严峻的是汽车服务市场的竞争,而配件供应在售后服务中的位置举足轻重,特别是售后服务配件的库存既占用了企业资
随着机构改革的深化和企业宏观管理职能的加强,原有的管理办公模式已不能适应日益增长的事务处理、信息共享等方面的要求。为了提高管理工作效率,完善管理模式,必须充分利用
软件分类有利于快速地对软件进行分析和评估,更好地指导软件开发过程中的进程计划、人员组织和资源分配等工作。现有的软件分类方法仅根据软件的外部属性对软件进行分类,不能