【摘 要】
:
多模式串匹配算法是网络内容过滤系统的核心技术。巨大的存储空间开销是制约多模式匹配串算法应用的瓶颈之一。提出一种基于子串识别的多模式匹配算法—HashBOM,该算法利用位
【机 构】
:
中国科学院计算技术研究所,中国科学院研究生院北京,信息内容安全技术国家工程实验室
【基金项目】
:
国家自然科学基金项目(61070026);国家重点基础研究发展计划基金项目(2007CB311100)
论文部分内容阅读
多模式串匹配算法是网络内容过滤系统的核心技术。巨大的存储空间开销是制约多模式匹配串算法应用的瓶颈之一。提出一种基于子串识别的多模式匹配算法—HashBOM,该算法利用位哈希表存储模式串的子串信息以大幅度减少存储空间,利用递归哈希函数计算字符串的哈希值以实现快速匹配。理论分析表明,该算法的空间复杂度为O(rm2),优于基于子串识别的匹配算法BOM的空间复杂度O(mr|∑|log2mr);该算法搜索匹配过程的平均时间复杂度为O(nlog|∑|)mr/m,与BOM算法相同(其中m为最短模式串的长度,r为模式串的个数,n为待匹配文本的长度,|∑|为字母表的大小)。在随机数据集和真实数据集上的实验表明,该算法的存储空间远远低于BOM算法,而匹配速度与BOM算法相当,非常适合在线实时匹配的应用环境。
其他文献
用高压电场技术对豆渣进行干燥,并与烘箱干燥的效果进行比较,发现高压电场干燥可以大大提高干燥速率;同时分析高压电场干燥过程中物料内部水分的变化特性.
在《清平乐?村居》课堂教学中,让学生在层次分明的朗读吟诵活动中感悟文本的言内情韵;拓展作者生平及作品,引导学生知人论世,无疑会激活思维,给他们提供从另一个角度解读文本
<正>1 949年5月1 9日,台湾省政府主席兼台湾省警备总司令陈诚颁布《台湾省戒严令》:自5月20日零时起在台湾省全境实施戒严。戒严,这个临时措施,在台湾却"临时"了38年又56天,
<正>伴随着友谊的氛围,我们在餐桌边坐下,希望未来能闪回此时。竹子微微摇动,轻柔的微风换起了我们的回忆。我坐着凝视着面前的纸和笔,思绪纷涌而至。此时,我在描绘姚永康,也
《全日制义务教育化学课程标准》提出了以提高学生的科学素养为主旨的新的课程理念 ,构建了全新的化学课程内容体系 ,倡导以科学探究为主的多样化的学习方式 ,重视科学、技术
<正> 双角子宫左角胎盘粘连 26岁,孕2,早产1。因停经8个月,阵发性腹痛2小时入院。入院时儿头入盆,宫口开大9cm,胎膜已破。于当天自然分娩一重1.9kg男婴。30分钟胎盘未娩出,阴
实验教学是初中生物教学当中非常重要的部分,学生的观察能力则是其学习生物及各类知识的重要保证。要想在实验教学的过程中培养学生的观察能力,生物教师就必须在生物实验的过
采用κ-ε模型和SIM PLEC算法,对石油焦煅烧回转窑内部的气相流场进行了数值模拟,通过改变回转窑的二次风与三次风的位置与方向,得到了相应条件下窑内的流场分布情况,并进行
在2010年召开的民航工作会议上,我国民航局正式提出了建设民航强国的战略构想,要想构建民航强国离不开有创新能力的高素质人才,因此这就要求各高校积极进行民航人才的全面化
股票市场与经济增长一直是近年来的热点问题,在国外的相关研究中,大多数认为股票市场通过其功能作用促进了经济增长,而我国情况又如何呢?我们在前人的研究成果上,对股票市场