基于代谢网络的系统发育重建方法研究

来源 :国防科技大学 | 被引量 : 4次 | 上传用户:kick_78
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
系统发育重建以重建物种间的进化关系为主要目的,是生物学领域的重要研究内容,在科研和生产等各方面都具有广泛应用。基于代谢网络的系统发育重建方法随着后基因组时代生物信息学的发展而出现,因有效避免了基因操作的影响而正受到越来越广泛的关注。基于整体代谢网络比较的系统发育重建策略主要包括以下几个步骤:首先重建所研究物种的代谢网络,并将这些代谢网络抽象表示为代谢物或酶的集合,然后利用描述集合间差异的距离函数确定各物种代谢网络之间的进化距离,最后根据得到的进化距离矩阵重建系统发育树。然而,在重建代谢网络和确定进化距离等关键步骤中,目前的方法还存在着诸多问题,例如重建网络的准确性不高、网络重建软件缺乏、所确定的进化距离误差较大等等。为此,本文利用生物信息学的研究手段对这些问题进行了深入的研究,并取得了以下具有创新性的成果:首先,针对以往代谢网络重建方法中存在的数据难以及时更新、数据有冗余、获取数据慢等问题,本文采用分而治之的递归策略,提出了一种基于KEGG数据库自下而上重建代谢网络的新方法。与以往的方法相比,本方法的优点在于:使用KEGG的Web服务直接获取数据,保证了数据的准确性和及时更新;依靠KEGG/PATHWAY数据库的数据选择机制选择数据,保证了用于构建网络的数据无冗余;通过设计和实现本地关系数据库将远程数据本地化,大大降低了数据读取和网络重建所需要的时间。评估结果显示,该方法不仅保证了用于重建代谢网络的数据是准确的并能够及时更新,而且还有效地提高了多物种多次重建情况下的网络重建效率。其次,基于代谢网络的系统发育重建往往需要对多个物种进行代谢网络重建。现有的软件大多侧重于生物学网络的可视化与数据整合,不能满足以计算为目的的多物种、大规模网络重建的需要。为此,本文运用Java语言高级编程与数据库技术开发了两款方便易用的代谢网络重建软件MetaGen和MetAtlas,不仅可以满足基于代谢网络的系统发育研究对于批量重建代谢网络的需要,也为代谢网络研究的深入开展铺平了道路。前者以命令行方式工作,可对代谢网络进行大规模地批量重建;后者以Cytoscape插件形式实现,可借助于Cytoscape强大的可视化功能和插件机制实现对重建网络的动态可视化和进一步计算。二者均具有跨平台、跨数据库和可扩展性好等优点,并且在GNU LGPL协议下完全开源。源代码、说明文档及其它相关资料可从http://bnct.sourceforge.net/直接下载。再次,以往基于代谢网络比较的系统发育重建方法通常将代谢网络抽象成为结点集合,并直接使用度量集合间差异的距离函数来确定网络间的进化距离。这类方法由于忽略了结点自身的差异,而使得确定的进化距离误差较大。为此,本文首次考虑到进化保守性和拓扑重要性等酶自身特性对于酶网络间进化距离的影响,提出了一种新的进化距离确定模型:WJD模型。以16S rRNA进化距离为参考,分别将WJD模型得到的四种进化距离与以往方法确定的进化距离进行了比较。结果显示四种WJD进化距离的误差都较小,从而说明了WJD模型的合理性。最后,虽然WJD进化距离确定模型考虑了结点本身特性的差异,但仍然没有摆脱集合论方法固有的未充分考虑网络结构特征的局限。为此,本文首次将信息检索中特征项提取的思想引入系统发育重建的研究中,并由此提出了一种新的系统发育重建模型TopEVM。该模型首先提取酶的共出现模式和拓扑特征模式,并将二者整合为加权向量,然后通过比较各物种相应的加权向量求取物种间的进化距离,进而重建系统发育树。以NCBI分类树作为参考,本文将TopEVM模型得到的系统发育树与以往方法得到的树进行了比较,结果表明TopEVM模型得到的结果更接近公认的NCBI分类结果。总而言之,本文采用生物信息学的手段就基于代谢网络的系统发育重建方法中代谢网络重建和网络间进化距离确定这两个关键步骤进行了深入研究。设计了一种基于KEGG数据库、快速可靠地重建代谢网络的新方法;根据该方法开发了两款针对不同研究目的的新的代谢网络重建软件;在分析有向网络中酶进化保守性与拓扑重要性的关系的基础上建立了一种新的进化距离确定模型,并借鉴信息检索中特征项提取的研究思想进一步提出了一种新的系统发育重建模型,从而为基于代谢网络系统发育重建方法的理论研究和实际应用做出了贡献。
其他文献
新时代背景下,高职人才“工匠精神”的培育模式探索,不仅对推动高职教育的创新发展有重要意义,而且能够促进我国“制造业强国计划”“中国质造”等国家战略的落实。“工匠精神”在新时代也被赋予了新的内涵,本文在分析德国、美国等发达国家有关高职人才工匠精神的培育实践,梳理先进经验,从我国高职人才“工匠精神”培育模式现状剖析,提出了加强实训基地建设、改进课程体系设置、引入“双标准”考评制度、完善相关立法等完善对
本文基于2011—2019年沪深A股上市公司数据,采用北京大学数字金融研究中心发布的数字金融普惠金融指数度量地区的数字金融发展程度,考察数字金融发展对当地企业全要素生产率的影响及机制。实证结果显示,数字金融发展显著地促进了当地企业全要素生产率的提升,且影响效应呈动态衰减特征。经内生性处理以及稳健性检验后,结论仍然成立。将指数进行升维后,发现数字金融覆盖广度和使用深度的提升均有助于提高企业全要素生产
光学微腔的发展在现代科学中占据重要的地位。回音壁模式(whispering gallery mode,WGM)谐振腔由于其:品质因子高,模式体积小,容易制备,成本低廉的优点,受到了研究人员的关注。WGM现象的产生依赖于微球的尺寸、形状、材料和耦合方式,所制造的谐振器被广泛的应用于温度、压力等灵敏度的测量,或是低阈值激光器,窄带宽滤波,非线性光学等方面的研究。本文讨论了WGM模式的发展历程与理论基础
现代学徒制以工学结合、校企合作为主要特征,将课堂教学与岗位实习结合起来,将传统学徒训练和现代职业学校相结合,实现理论与实践的有效统一。现代学徒制把学生的职业发展和全面发展相结合的一种独特的人才培养模式。当前,我国对技能型人才的需求很迫切,因此,探索现代学徒制人才培养模式意义重大。本文分析现代学徒制在计算机网络专业的实施路径,探索应用型计算机网络专业的建设的新思路。
软磁复合材料是由金属软磁颗粒经界面绝缘包覆复合而成的软磁材料。作为一种电磁转换功能材料,其兼具金属软磁高饱和磁化强度和铁氧体软磁高电阻率、低损耗的优点,广泛应用于电力、通讯、能源和交通等领域。目前,制约软磁复合材料发展的主要问题在于:非磁性包覆层“稀释”了材料的磁感应强度,而非磁性间隙又降低了软磁复合材料的有效磁导率。因此,如何通过合理的界面设计、选择合适的绝缘介质以及改善异质界面,成为优化软磁复
仲秋,南方某海域风急浪高,南部战区空军联合海军部队组织多个机型航空兵以及地导、雷达、舰艇等作战力量在海天之间展开联合训练。记者在指挥所屏幕上看到,多型战机从南方某机场依次起飞,在某海域上空集结后,干扰机迅速开机、实施远距干扰,进而开辟电磁走廊。随后在空中预警机的指挥下,突击机、掩护机按照战术队形,沿着电磁走廊迅速前进,而此时海面舰艇和驻海岛雷达
期刊
本文以新型多薄层组合材料在脉冲X射线辐照下的热-力学效应为研究目标,对TC材料和GC材料准静态和动态力学性能及热物理性能进行了实验测量,建立了多薄层材料的等效模型,对多薄层组合材料在脉冲X射线辐照下的汽化反冲冲量和热击波进行了数值模拟研究。本文的主要研究成果及结论如下:1、对TC材料和GC材料的准静态压缩性能进行了实验研究,测量出了两种材料的弹性模量、泊松比和屈服强度,获得了两种材料的剪切模量分别
随着工业化的不断推进,环境污染问题也越发尖锐严重,对于废气,废液,废物等问题的治理也愈发刻不容缓,其中这些气体许多都会造成人体急性或慢性的健康影响。因此,需要制造出高效且针对各种有毒、有害、易燃、易爆气体的检测方法及设备仪器。值得注意的是,金属氧化物半导体由于其低成本、低功耗、可靠和简单可用性获得广泛应用。但随着不断对更好的选择性和更高灵敏度的金属氧化物半导体传感器的需求增长,就需要更合适的方法来
在本文中我们主要研究了原子在不同频率强度超短激光脉冲作用下的原子的相干光辐射过程。重点观察了理论已经很完善的高次谐波以外的其他相干辐射过程和相应的光谱,特别是超拉曼谱和太赫兹辐射谱。其具体内容由以下四部分组成:首先是基础理论部分。介绍了无激光场作用时能量本征态波函数的求解方法,然后是在激光场作用下利用分裂算符法求解多维的偶极近似和非偶极近似下的含时薛定谔方程以得到波包演化的具体步骤。当软核势模型中
为了解2019年冬季江苏省部分地区鸡传染性支气管炎病毒(IBV)的流行情况,本试验对江苏省内3个地区分离的23株IBV的S1基因进行了遗传进化分析,首先对采集的病料进行毒株分离并进行病毒核酸测序,然后采用MEGA 5.2、Simplot、Megalign、RDP 4等分析软件对IBV的S1基因序列进行分析。结果显示:23株分离毒株中有7株为HN08型(占30.4%),另外16株为QX型(占69.6