【摘 要】
:
在20世纪,随着人类基因组计划中精确的DNA全序列图的完成,近年来基因库中的碱基数目大量增长,为了能够管理好这些数据并挖掘出有用的生物信息并分析它,众多的生物学家、数学
论文部分内容阅读
在20世纪,随着人类基因组计划中精确的DNA全序列图的完成,近年来基因库中的碱基数目大量增长,为了能够管理好这些数据并挖掘出有用的生物信息并分析它,众多的生物学家、数学家、计算机科学家积极的在这个新兴领域中进行研究,生物信息学即计算分子生物学就在这样的研究过程中产生的交叉学科。生物序列的分析比较是计算生物学的主要研究内容之一,通过近些年的研究发展,生物序列的比较分析方法一般分为两大类:一种是比对方法,另一种是非比对方法。鉴于目前DNA序列数据量庞大,比对方法计算量过大、耗时长,算法成本比较高,非比对方法成为此领域研究者关注的重点。本文以二阶马尔可夫模型为研究对象,提出DNA序列非比对模型,主要内容概括如下:1.对DNA序列的比较,判断他们之间的相似程度,从而推测他们的结构、功能以及进化的联系。利用加权相对熵的二阶马尔可夫模型的基本原理,对DNA序列进行比较。DNA序列将其视为一个马尔可夫链,取状态空间I={A,T,G,T},使用二阶转移概率矩阵来描述DNA序列,得到DNA序列的特征值,进而利用特征值定义DNA序列的相似性度量,得到能够对DNA序列进行比较的新方法,并利用这个方法对30个物种的线粒体DNA序列进行分类。2.在DNA三联体密码子表示的基础上,建立了DNA序列新的几何图形表示模型,将DNA序列映射成一条三维曲线,并将曲线数值化后进行特征值的提取。通过距离矩阵重构8种病毒cRNA序列NA片段的进化树,并分析其相似性。为DNA序列的描述提供了新的手段。
其他文献
以Unipol聚乙烯气相流化床为研究对象,基于铬系催化剂多活性中心聚合机理,建立了乙烯-1-烯-1-己烯三组分共聚制备高性能聚乙烯的熔体流动指数和密度的预测模型,并采用生产过程中
土壤动物作为生态系统的一个重要组成部分,其在土壤有机质分解、养分循环、改善土壤结构、影响土壤健康和植物演替中起着至关重要的作用。经调查,青海三江源的4种生态系统中,
排沙漏斗是利用螺旋流具有强烈的水沙分离效果进行二次排沙的水工建筑物,具有截沙率高,耗水率低的特点。本文以陕西省东雷抽黄灌区拟建的三并联排沙漏斗为工程背景,采用数值
蒸散发也即生态耗水量,是水循环的重要组成部分,全球陆地降水的70%是以蒸散发的形式返回大气,而在干旱区蒸散量可高达降水量的90%,它作为地表的能量平衡和水量平衡的重要组成
中国石油化工股份有限公司北京化工研究院开发的苯酐催化剂,在中国石油化工股份有限公司金陵石化公司苯酐装置两年多的使用效果证明,该催化剂的性能基本达到同类进口催化剂水平
ArcelorMittal公司(世界领先的钢铁矿业公司)、LanzaTech公司(碳回收公司)和Primetals技术公司(领先的钢铁业技术和服务供应商)正计划联合建设欧洲的首套商业规模生产装置,从炼钢过
如今,汽车已不再是富人独享的奢侈品,而是渐渐走进了寻常百姓家。然而,购买汽车却不像买衣服那么简单,这是一件动辄数万元甚至数十万元的耐用消费品,购买的手续复杂而且费用繁多。
河南能源化工集团安化集团公司安阳200kt/a乙二醇装置在安全环保运行和质量稳定的前提下,装置负荷提升至92%,实现日产乙二醇551t,产品优级品率保持100%。
苜蓿王、菲尔兹、金字塔、里奥、辛普劳2000、诺瓦、霍普兰德、多叶苜蓿、大叶苜蓿、Spreador-3、Pick3006和Pick8925是从美国和加拿大引进的优良紫花苜蓿(Medicagosativa)品种
在换热网络的总复合曲线上,当夹点之上出现内部局部热源或夹点之下出现内部局部热阱时会形成热口袋。通常热口袋中物流间相互换热,不需要公用工程提供热量。考虑将热口袋与精