论文部分内容阅读
随着人类基因组测序计划的完成,生物学研究的重点正从积累数据向分析解释这些数据过渡,生物信息学即计算分子生物学便应运而生。生物序列比较是计算分子生物学的主要研究内容之一,序列比较的主要目的是通过分析序列之间的相似性阐明序列之间的同源关系、寻找序列的编码片段以及从已知序列预测新序列的结构和功能。本文以生物序列的比较分析为背景,提出了新的相似度量,为生物序列的分类、分析和比较等研究提供新的方法。另外,还列举了新的相似度量在生物序列的相似性分析问题中的具体应用。本文研究内容可以概括如下:1.在第二章,提出一种基于DTW(动态时间弯曲)距离的DNA序列相似性度量方法。根据复平面上DNA序列的图形表示及复向量的主要特征—模和相位,把DNA序列转化为模序列,计算其DTW距离来度量序列相似度以表征DNA序列属性,并用这个方法比较分析七种东亚钳蝎神经毒素基因序列的相似性,验证了该度量方法的有效性和准确性。2.在第三章,根据DNA序列的一种三维空间表示,得到了与其对应的时间序列,基于提出的DTW距离算法,分析了human,chimpanzee,gorilla等11个物种的DNA序列的相似性,再次验证了该算法的有效性。3.在第四章,根据蛋白质序列的一种数值刻画,利用DTW距离算法比较了9种动物的神经元基因序列的相似性,同样得到了和事实比较相近的结果。