基于LZ算法的多序列比对方法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:jmgxy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对生物DNA多序列比对问题,提出了基于LZ算法的渐进式多序列比对方法—LZ_MSA,其空间向量是采用10种复制方式进行构造,使得多序列比对方法LZ_MSA中的两两比对时间复杂度为O(N log N)。该方法特点是:序列比对转为向量比对,指导树可动态修正。采用BAlisBASE库中的标准数据集的5个子集,对LZ_MSA与ClustalW,MAFFT进行测试比较,结果表明本文方法能在保证比对精度的前提下,大大缩短了比对时间。本文研究了生物信息学中的渐进式多序列比对算法,主要研究的内容如下:首先,介绍了序列比对涉及的基本内容:序列比对问题的描述,序列比对涉及的打分系统,替换矩阵,序列比对标准测试数据集和评价标准等。其次,对ClustalW渐进式多序列比对方法进行了深入研究,通过对其实现过程具体分析,指出了其优点与不足。然后,针对ClustalW中两两比对计算量大,容易陷入局部解的不足,提出以LZ算法为基础的渐进多序列比对方法LZ_MSA,使用Microsoft Visual C++开发工具设计并实现了一个基于Windows操作系统的多序列比对程序LZ_MSA。最后,利用BAliBASA库中的测试数据对LZ_MSA进行测试,并与ClustalW,MAFFT进行对比分析,结果表明LZ_MSA与其相比具有可比的精度,而时间上却有更小的开销。这也表明该方法是有效的多序列比对方法。
其他文献
随着科学技术的不断发展,人们对实际生产过程的分析要求日益精密,各种较为精确的分析和科学实验结果表明:任何一个实际的物理系统都是非线性的。因此研究非线性系统的稳定控
随着WebGIS技术的快速发展,借助于WebGIS构建跨平台、广泛可访问、低维护费、高效、易于扩展的地理化交通管理信息平台已成为可能,并已经具有少量的实际应用。但由于WebGIS在交
非线性、非高斯滤波技术被广泛应用于军事、科技、工程和经济等多个领域,一直以来备受人们关注。最常用的非线性滤波方法是广义卡尔曼滤波(EKF),这种方法先将非线性系统方程用泰
现在的工业生产过程控制领域,越来越多的采用控制器模块加上数据采集模块组成系统的方案来实现生产流程的自动化控制。这种构成控制系统的方案具有功能强大、成本低、灵活度高
随着红外采集设备性价比的逐渐提升,红外图像采集设备逐步被应用于实际生活中,而人脸识别具有安全性、方便性等特性,因此将两者结合实现完整的红外人脸识别系统是非常必要的。目
气液两相流广泛存在于现代工业,但其流型辨识和流量测量技术一直是国际上没有很好解决的一个难题,国内外研究人员进行了多方面的研究与探索。中国石油大学(华东)自动化系致力于开
可靠性理论已被广泛用于电力系统、制造系统和工业系统中.保持较高的系统可靠性在实际应用中是非常重要的.在传统的系统可靠性的研究中,系统和各部件的寿命都看作随机变量.然
小型扬声器是一种把电信号转化为声音信号的发声设备,广泛的应用于现代消费类电子产品、计算机、通信、汽车电子等领域,其音质的好坏直接由构成扬声器的重要部件音膜决定。音膜
风能是一种可再生的绿色能源,在能源日益紧缺的当今社会,越来越受到重视。中国2006年出台了《“十一五”十大重点节能工程实施意见》。本世纪将是可再生能源和新能源逐渐替代常
近些年,随着因特网应用的日益普及、计算机技术的迅猛发展以及信息共享程度要求的不断提高,很多嵌入式设计也已经被嵌入式产品设计师普遍应用于专用的、非PC的设备中。例如各种