【摘 要】
:
模式匹配(也称为串匹配)是计算机科学中基本问题之一,已经广泛地应用到了生物研究、音乐信息检索和序列模式挖掘等各个领域。在模式匹配中,有的仅仅考虑最后一个模式子串在序
论文部分内容阅读
模式匹配(也称为串匹配)是计算机科学中基本问题之一,已经广泛地应用到了生物研究、音乐信息检索和序列模式挖掘等各个领域。在模式匹配中,有的仅仅考虑最后一个模式子串在序列中匹配的位置,这种模式匹配称为宽松模式匹配;更为挑战性的问题是对每个模式串均考虑其在序列串中匹配的位置,而这种模式匹配称为严格模式匹配。严格模式匹配中近似模式匹配允许模式串与所匹配的序列串之间存在一定差异,增加了匹配的灵活性。本文研究的是具有Hamming距离的近似模式匹配。无重叠约束是要求任何两个出现中不能在相同位置处使用序列中相同字符。具有无重叠约束的模式匹配问题是指给定模式P在序列S中的所有出现集合中找到最大子集C,使得集合C中任意两个出现均是无重叠的出现。目前研究的模式匹配多为精确匹配,精确匹配要求每个字符必须匹配,一定程度上限定了匹配的灵活性。为此本文提出了无重叠约束的近似模式匹配问题(Approximate Pattern matching with Non-Overlapping constraints,APNO)。我们运用网树结构解决该问题,提出了NETLOR和NETROL算法,并对其改进提出了NETLORE和NETROLE算法。该算法在求解时,先将模式匹配问题转换为一棵网树,然后在网树中每次查找树根叶子路径,并将该路径所对应的解作为一个无重叠近似出现,之后依据树根叶子路径在网树的局部范围内进行快速剪枝,为下一次查找树根叶子路径做准备。最后大量实验验证了本文提出的四个算法的正确性,并且验证了NETLORE是更为高效的算法。
其他文献
RFID(Radio Frequency Identification)射频识别技术,是一种采用无线射频方式进行非接触双向数据通信,对目标加以识别并获取相关数据集的技术。因为其具有不需要人工干预、不
该论文综合运用图像处理和模式识别技术,比较深入地研究了自动指纹识别技术.全文内容共分五章.第一章绪论;第二章指纹图像预处理;第三章指纹分类;第四章基于分类的匹配;第五
随着集成电路制造工艺的快速发展,处理器和主存之间的性能差距越来越大。为了填补该性能差距,现代处理器已经把芯片上一半以上的晶体管用于实现多级片上高速缓存。其中片上末级
漫画作为一种特殊的休闲娱乐类出版物,通常由简单形象的绘画内容和少量的文字构成,深受不同国家各年龄段阅读者的喜爱。随着移动终端(如智能手机、平板电脑、电子书阅读器)的普及
论文的主要工作包括:网络视频领域相关技术的研究与学习,嵌入式Linux系统的设计,Linux下的视频采集和MPEG-4视频压缩的开发,网络传输部分的开发以及在嵌入式硬件平台上的移植
该文围绕人工智能领域中时空推理(Spatio-temporal reasoning)及应用的若干关键问题进行了研究和探讨.时空推理由时态推理和空间推理发展而来,已成为近年来人工智能以及地理
借鉴传统图书馆的知识组织理论,该文根据DL环境的要求对传统的知识组织工具——分类法和主题词表加以改造,并结合DL中最重要的信息资源——语义元数据的特点,将它们三者集成
作者目前工作的北京住力电通光电技术有限公司准备实施一套ERP系统,从产品的介绍到与供应商的交谈和演示中能了解到这套系统的质量管理的功能不够理想,只能够作为生产部质量管
互联网已经成为信息社会的重要基础设施。而随着社会的发展,当今互联网出现了路由扩展性、动态性、安全性、可管理性、可靠性、QoS以及能耗等方面的问题,已经不能满足高信息时
本文综合已有安全操作系统方面的实际研究成果和经验,提出了一种能从应用层动态载入、具有模块化结构的操作系统安全内核的构建模型。KNumen就是根据该模型在Linux平台上开发