论文部分内容阅读
本文从研究生物序列的局部相似性查询入手,提出了一种基于块排序结构压缩索引结构的生物序列查询算法。一方面降低了索引的空间要求代价,提高空间利用率;另一方面通过引入片段向量的概念,在片段向量的扩展同时,进行动态规划算法,基于A*搜索算法原理,在搜索过程计算剩余查询序列完全匹配的上界,首先扩展最可能产生结果的片断向量,从而提出更好的削减策略,进一步提高了过滤效率,而且根据索引的特点,在后处理时提高返回结果的速度,降低了时间复杂度,从而在保证了查询结果的准确率前提下,提高了查询的效率。
基于块排序索引的序列查询算法进行了正确性验证和性能实验分析,大量的实验表明,该索引结构在序列局部相似性查询的情况下优于现有索引结构,是一种有效的处理生物序列的相似性查询的索引结构。