【摘 要】
:
从微生物组数据中搜集蛋白质家族的同源序列,补充其分子进化信息,进而预测可靠的三维结构与功能,是一个微生物基因挖掘领域中的新兴交叉学科。基于已有研究的结果,理论上搜集越多的微生物组数据能够预测出更多的蛋白家族的结构和功能,展现出巨大的科研与应用潜力。然而,在使用微生物组数据为蛋白质补充同源序列时,忽略了功能基因的来源物种和生态位(微生物生存环境的本体论注释)等信息,阻碍了探究预测出的蛋白结构与来源微
论文部分内容阅读
从微生物组数据中搜集蛋白质家族的同源序列,补充其分子进化信息,进而预测可靠的三维结构与功能,是一个微生物基因挖掘领域中的新兴交叉学科。基于已有研究的结果,理论上搜集越多的微生物组数据能够预测出更多的蛋白家族的结构和功能,展现出巨大的科研与应用潜力。然而,在使用微生物组数据为蛋白质补充同源序列时,忽略了功能基因的来源物种和生态位(微生物生存环境的本体论注释)等信息,阻碍了探究预测出的蛋白结构与来源微生物组的关联性。此外,堆积同质化的微生物组数据造成了“边际效应”递减等问题,使得补充蛋白质的同源序列的效率低下。解读蛋白质三维结构预测的结果时,集中于蛋白质结构解析和分子功能预测,缺乏对其在群落中的生态及进化规律进行深入挖掘。针对以上问题,本研究聚焦于利用微生物组数据预测蛋白质结构和功能这一方向,系统地开展了该方法的可行性探究,构建了人工智能模型用于高效地补充蛋白质家族的同源序列并利用富集分析揭示了预测出可靠结构的蛋白质家族在生态系统中的重要功能,提供了一种开展生物资源挖掘、药物研发等应用研究的新的大数据手段。具体如下:1)揭示利用微生物组数据用于预测蛋白质家族的三维结构的可行性和潜在规律。利用海洋微生物组数据中9 700万非冗余的基因,补充蛋白质家族的同源序列,预测出27个全新的且在Pfam中结构未知的蛋白质家族的三维结构和功能。而且这27个蛋白家族中高频出现的来源物种在海洋微生物群落中占主导作用。此外,预测出的蛋白家族在微生物群落中具有重要的生态功能,例如参与了光合作用功能通路来促进海洋生态系统的能量与物质循环。这些结果证明了这一方法的可行性,提供了进一步预测出其他未知结构的蛋白的一个崭新的思路。2)解析“生态位-微生物基因-蛋白结构”的关联性,构建人工智能模型用于靶向地补充蛋白质的同源序列,提高微生物组预测蛋白结构的效率和精度。基于四个具有代表性的生态位(土壤,湖泊,肠道,发酵罐)中的42.5亿微生物组基因,预测出了1 044个未知结构的蛋白质家族的三维结构。利用这1 044个蛋白家族的物种和功能组成以及来源生态位信息,解析了“生态位-微生物基因-蛋白结构”的关联性,揭示了来源于微生物组的同源序列在不同生态位中具有不均衡的分布和富集特征,并通过边际效应模型量化了这一特征。基于蛋白质的同源序列的不均衡分布特征,构建人工智能模型(Meta Source模型)来靶向地预测对于给定蛋白家族,存在最多同源序列的生态位,从而高效补充蛋白质的同源序列,进而使用C-I-TASSER工具预测出蛋白质的三维结构。基于Pfam数据库中已知结构的蛋白家族进行验证,使用Meta Source模型能够准确地预测出其三维结构并显著降低同源序列的搜索时间(降低2/3)。3)以抗生素抗性基因(antibiotic resistance gene,ARG)为研究对象,探究预测出的蛋白家族在微生物组中的重要生态和进化作用。抗生素抗性基因是一类具有重要医药和环境保护意义的功能基因(蛋白),大部分从微生物中分离。基于来自Tara Oceans项目的132个全球海洋微生物组样本,鉴定出了1 926种抗生素抗性基因,并揭示了采样深度对抗生素抗性基因的组成影响。基于抗生素抗性基因在不同物种中的分布特征,利用富集分析发现了1 659种抗生素抗性基因富集在13个属中。通过挖掘抗生素抗性基因、物种以及环境因子之间的关联模式,发现在面对环境压力时,同一环境中的富集抗生素抗性基因的物种的丰度大于其他物种,表明抗生素抗性基因可以帮助其富集的物种获得生存优势。这一研究深入地解析了抗生素抗性基因在微生物群落中的生态和进化模式,为研究重要蛋白质在生态系统中的重要功能提供了崭新的研究策略。总而言之,本研究聚焦于利用微生物组预测蛋白质结构和功能这一交叉方向,开展了可行性研究,优化了数据挖掘方法,并挖掘了蛋白在群落中的生态模式。这一跨领域的微生物组数据挖掘研究工作的开展,在微生物生态学、微生物功能基因组学、蛋白质结构功能研究等方面,均展现出了巨大的研究价值和应用潜力,为解析微生物组大数据、基于蛋白质的药物设计等应用领域提供了有力的手段,最终服务于人类健康,环境保护和社会可持续发展。
其他文献
黄土塬区作为黄土高原水土流失最严重的地区之一,所面临的最大问题是不同程度的沟道溯源侵蚀所导致的沟头前进,沟底下切,沟壁崩塌、滑塌、泻溜,沟岸扩张,塬面逐步萎缩和破碎化,造成塬面大量的农田和道路被损毁,严重破坏了农业资源和交通资源,对城镇民居安全造成极大的威胁。且黄土塬区以水力侵蚀为主,径流主要来源于塬面,泥沙主要来源于沟道。因此,有必要进一步对细沟溯源侵蚀下的沟道发育方式及侵蚀过程进行研究。以往通
研究目的携带新德里金属β-内酰胺酶-1(NDM-1)的革兰氏阴性菌(G-)是一类对几乎所有β-内酰胺类抗生素都具有抗性的多重耐药“超级细菌”。目前,NDM-1耐药菌肆虐全球,已成为导致临床重症感染死亡的重要致病菌。而且,NDM-1耐药菌可以通过释放含有NDM-1酶和blaNDM-1耐药基因的外膜囊泡(OMV)促使耐药基因在不同菌种之间广泛快速传播,进一步加剧耐药性的全球播散,这已成为临床上难以控制
沟渠湿地作为农田与下游水体的过渡,具有排水和生态湿地双重功能,在减少农业面源污染和保护下游水环境方面发挥着巨大的作用。然而,对于干旱半干旱区承担农田排水控盐任务的沟渠湿地而言,农田盐分输出成为影响湿地生态功能的主要问题。本文以陕西卤泊滩盐碱改良区农田-沟渠湿地系统为研究对象,采用室内外试验、理论分析和模型模拟相结合的方法,开展了不同水文年下农田-排水-湿地水盐动态研究,为兼顾灌区农业生产和生态环境
[目的] 建立检测犬血浆中阿莫西林和克拉维酸浓度的UPLC-MS/MS方法,并进行犬口服国产阿莫西林克拉维酸钾片与参比制剂的生物等效性评价。[方法] 以乙腈和甲酸水溶液为流动相,经HSS T3色谱柱梯度洗脱,阿莫西林和克拉维酸分别用电喷雾正、负离子模式进行多反应监测,血浆样品用乙腈沉淀蛋白,二氯甲烷萃取,克拉维酸增加正己烷除脂,经方法学验证后,分别检测血浆样品中阿莫西林与克拉维酸浓度。生物等效性试
人类活动造成的全球变化引起陆地生物圈的深刻响应,并影响陆地生物圈为人类提供的生态产品和服务,进而威胁到生态安全和社会经济可持续发展。位于我国半干旱草原是全球面积最大的生物区系之一——亚欧大陆草原的重要组成部分,也是我国最为重要的畜产品供应基地和生态屏障,但是该区生态系统相对脆弱。20世纪中期以来,过度的草原利用引起了我国半干旱草原生产力降低、物种丰富度下降、土壤沙化等问题。1998年以来中国实施了
随着事业单位的改革与发展,会计核算工作也面临着更大的压力,因此,必须提升会计核算的要求与标准,才能够提升事业单位的服务水平,为单位的可持续发展创造有利条件。事业单位的会计核算只有实现创新与优化,积极转变传统的核算模式,才能够满足目前新制度的需求,以便于对资金起到更强的监督作用,实现单位资金的合理配置。基于此,本文阐述了新会计制度对会计核算工作产生的影响,对影响会计核算的因素进行了精细化分析,提出了
现代社会经济和科技的飞速发展给人类工作和生活带来了无穷便利,但与此同时高速运转的工作、日益增长的经济负担、人际交往关系处理甚至是全球性新型冠状病毒蔓延等使人们承受着越来越大的心理应激,军人作为一个特殊群体,随时面临不可预测的心理应激事件,其也是心理应激的高发群体,军事应激所导致的负性影响是造成部队非战斗减员、影响战斗力的重要因素之一。正性心理应激有利于机体对外界刺激做出积极反应,负性心理应激则会导
【背景】近年来的研究显示,高质量的结肠镜检查显著降低了结肠癌的发病率及癌相关的死亡率。高质量的筛查、腺瘤切除和随访是结肠镜诊疗的关键。国内外诸多结肠镜检查指南认为,若干指标可用于衡量结肠镜检查的质量,包括腺瘤检出率、盲肠插管成功率、退镜时间和肠道准备质量等,此外,腹部不适感或疼痛感是患者检查中体验,也可作为评估结肠镜检查诊疗质量的指标之一。在既往的报道中,对腺瘤检出率以及退镜时间的研究较为充分,而
胃癌是常见的消化系统恶性肿瘤,虽然胃癌患者以中老年人为主,但近年来年轻人胃癌的发病率不断增长,逐渐呈现年轻化的趋势。年轻患者的胃癌被称为早发性胃癌(EOGC),而早发性胃癌患者与中老年患者相比,有着不同的临床病理特征及预后。EOGC患者早期临床表现并不典型,往往出现明显症状时已是晚期,所以对EOGC患者做到早诊断、早预防及有效的治疗手段是难点也是关键。本文作者通过对EOGC患者的危险因素、早期诊断
<正>古往今来,多少无辜生命在历史的长河中悄悄离去,战争无疑是残酷的、悲惨的,就连雄才大略的曹操也为之动容,他在《蒿里行》中写道:“白骨露于野,千里无鸡鸣。生民百遗一,念之断人肠。”伟大的现实主义诗人杜甫在《垂老别》中也悲叹道:“积尸草木腥,流血川原丹。”因此,谈及战争,只会让说者伤心,听者流泪。但有时候,亲身经历战争的人总有自己的感受,如“荷花淀派”代表作家孙犁笔下的《荷花淀》,在这篇文章里面,