论文部分内容阅读
生物体产生的难以置信的特性是自然选择的结果。自然选择对生物进化如此有效的基本条件应是:第一,生物体具有携带能被继承的“信息”载体,能够被继承的“信息”被称做基因信息,基因信息由有限个基因码元排成的基因序列所表达;第二,存在一种精确复制基因信息的生化机制,这种复制过程会产生错误,但是错误必须很少,复制是几何增长;第三,基因信息的复制过程必须伴随基因产物的出现,生物体的自我复制是基因信息复制和基因产物出现的统一过程;第四,基因信息复制过程中产生的错误(变异或突变)本身应能被复制,有益的变异才能被自然选择保留。本文研究的主要对象是关于基因信息。从信息论角度,将生物体看作是一种特殊的信息处理系统,基于通信系统结构,将分子生物的信息传递过程用通信模型描述。结合生物学理论,运用统计学和信息论方法对基因数据进行分析和有用信息提取。基于这种思路探讨生物细胞内最大信息源——基因组DNA序列的冗余、编码特性、SD区域的位置识别以及16S rRNA对基因序列可能的差错控制特性。论文的主要研究工作有:(1)以生物学研究成果为基础,利用interned获取开放的生物信息学资源,分析基因组DNA的编码区、非编码区可能的编码特性。(2)利用最小汉明距离译码,分析核糖体16S rRNA的突变对原核生物DNA翻译效率表达的影响,仿真结果表明原核生物可能以16S rRNA作为一个标准的差错校验码对DNA全序列进行检错与纠错,再次证明了运用通信编码理论分析原核生物遗传信息传递的可行性。(3)根据SD序列的特点,利用流密码中Berlekamp-Massey算法,应用LFSR模型,导出校验矩阵,仿真实验证明,运用该校验矩阵所得到的校验值不但可以标明原核生物的SD序列的起始位置,而且还可以标明起始密码子的位置。运用学科交叉融合能揭示生物分子数据的内涵,数据之间的复杂联系,从而探索这些数据中蕴含的生物学知识和规律。结合信息论分析DNA序列,有望揭示生物分子信息的本质,使人类有可能了解、掌握遗传信息的编码、传递及表达,从而加快了解自身的进程。