论文部分内容阅读
随着生物序列测序技术的飞速发展和一系列测序计划的实施与完成,DNA序列数据库中积累起了海量的序列数据信息。如何有效的处理、分析这些生物数据信息成为当今科学研究领域面临的一项艰巨任务和挑战。由于从DNA序列数据中直接的获取有用的信息时碰到了诸多困难,所以有效和多样的分析方法被人们提出来尝试应用到DNA序列数据的分析研究中。在最近的几年中,基于DNA序列图形表示的方法研究来分析DNA数据信息成为了生物信息学领域的热门课题,受到了广泛的关注。本文主要在DNA序列图形表示方法及基于图形表示的相似性分析方面进行了研究。主要的内容包括以下几个方面:
第一章在DNA序列图形表示方法的研究背景介绍的基础上,介绍了一些相关生物信息学和生物分子学基本概念;
第二章对DNA序列图形表示方法做了比较全面的介绍,并且对基于DNA序列图形表示方法的序列相似性比对方法做了重点介绍;
第三章在Randie等人提出的2D图形表示基础上给出了一种新的DNA序列的3D图形表示方法。这种表示方法同样避免了重叠和自交叉现象的产生。基于提出的图形表示方法,本文对11个物种的β-球蛋白基因的第一个外显子进行相似行分析,得到了很好的结果。新的图形表示方法在序列图形转化的过程中,考虑了碱基结构的同时也考虑了碱基间的连接关系,从而使序列的图形表示包含更多的生物序列信息,能够更好的反应序列的特性,也使序列间的相似性分析更加准确合理,对DNA序列图形表示理论的发展提供了新的思路。