基于信息熵的细菌DNA序列分析

来源 :陕西师范大学 | 被引量 : 0次 | 上传用户:luohuaxiyushi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从遗传和变异的观点来看,细胞本身就构成了一个信息处理的独立基本单元,从DNA自身的复制、转录RNA到翻译为蛋白质,是对生物的遗传信息进行存储、传递。按传统的遗传学观点,所有的遗传信息都蕴含在遗传物质之中,这个信息处理系统掌控着生物的发育、生长和遗传。那么要揭示生命体内部的具体工作机制,使用信息科学中的方法来研究遗传信息的存储、传递和表达是必不可少的。信息论是研究信息的度量、传递、交换和存储的一门学科。由于遗传信息作为信息的一种,其存储和传递必然遵循信息存储与传递的一般规律,因而可以采用信息论方法对遗传信息进行分析。本文首先介绍了课题背景,国内外的研究现状以及研究目的和意义,紧接着介绍了信息论中关于信息熵的一些基本概念,如联合熵、条件熵等问题,提出了一种基于信息熵理论分析DNA序列的方法。在后基因组时代,生物信息学领域的研究热点之一就是如何快速而又准确的标定DNA序列的编码区和非编区。先前已有很多种方法被提出用于区分编码区和非编码区,但都需要特定的DNA数据集,不具有普适性,然而信息熵的方法弥补了这一缺陷。首先对1947种细菌基因组编码区和非编码区的信息熵进行了计算,发现二者的信息熵曲线呈现振荡式,编码区的信息熵值略大于非编码区的信息熵值;接着用最新提出超信息熵(super information entropy,简称SIE)的方法计算了编码区域和非编码区域中的超信息熵,并且对二者进行了分析比较。比较显示:在真核生物种,超信息熵在编码区和非编码区有很好的区分度,然而在细菌这种原核生物中,其编码区和非编码区的超信息熵几乎区分不出来;同时,对编码区和非编码区的超信息熵的差值频率进行了统计,结果表明:超信息熵差值的概率分布图呈现出高斯分布,编码区的超信息熵值略大于非编码区,和大多数真核生物的结果刚好相反,再者二者的超信息熵的区分度不是很大。最后我们选取了有代表性的6种细菌DNA序列,对其语言学特征进行了研究,理论上如果所有的单词文本都按照从高频到低频的等级顺序进行按序号排序,在双对数曲线下的斜率等于-1即满足齐普夫定律(zipf)。在真核生物中,研究表明:用齐普夫定律的方法对DNA碱基对序列的语言学文本进行了统计,发现非编码区比编码区更接近于人类自然语言,然而在细菌的基因组中对于编码区和非编码区而言,用语言学齐普夫定律的方法进行分析,发现这种方法几乎区分不出来二者,编码区和非编码区的曲线图几乎是重合的,而且对其曲线图进行了线性拟合,发现二者的斜率远小于-1,这表明这种语言学的方法细菌DNA序列中是不适用的即该方法不具有普适性,从另外一个角度也表明细菌等原核生物比起真核生物没有较强的语言学特性,而且进一步说明非编码区并非真正意义上的“垃圾DNA”。本文使用信息熵方法所得的结果表明,信息熵能够很好地表征一些生物学特性,它在生物信息学中的应用还有待人们进行更深入的研究。
其他文献
该文主要根据事业单位工作的实际,对政府收支分类改革的主要内容及特点以及财务工作的主要变化等问题进行了分析,并提出了事业单位财务工作如何应对政府收支分类改革的具体建议
《上肢骨及其连接》的内容是护理人员认识人体结构中运动系统的重要组成部分之一,其内容要求学生必须掌握。职业学校一年级学生,他们缺乏专业基础,对专业领域只停留在感兴趣
<正> 不久前,法国国际私法杂志发表署名文章,详细地评价了由宁波大学法律系主任余先予教授主编、国内多位法学专家参加编撰,已由北京法律出版社出版的《冲突法》一书。该文指
目的探讨血清胎盘生长因子在先兆子痫预测中的价值。方法选取2009年1月至2011年6月本院住院治疗的32例先兆子痫孕妇为研究对象,将其设为观察组,将其发病前6周、7周和8周的血
浙江华电乌溪江水力发电有限公司(以下简称乌溪江公司或公司)近年来不断开拓创新,提质增效,全力开展管理创新活动,挖掘潜力,强化水库、机组经济运行管理、党建、7S管理、精益
计划经济体制的国家在进行经济体制转型时,到底是采用激进方式,即"休克疗法";还是采用渐进方式?作者认为转型的过程是一个长期的历史过程.它包含了几个不可或缺的子过程:自由
<正>苏轼一生对月亮情有独钟,在作品中喜用月作意象。其笔下的明月浸透了独特、丰富、复杂、幽深的人生顿悟和喟叹,寄托着高洁的情操。苏轼曾悲月。"世事一场大梦,人生几度秋
本文阐述了笔者在独立院校的课程教学中所观察到的一系列问题,通过对比国内外高校的结构力学教学改革现状,并且结合学生的学习特点,在优化教学内容、培养学生能力、转变教学
用户是图书馆资源的利用者,是图书馆服务的对象。文章试图从图书馆资源建设、空间建设、馆员与用户交互、信息服务质量评价等四个方面着手,建立提升用户与图书馆关系的机制,