论文部分内容阅读
建立数学模型并开发相应的算法对于人们充分理解和有效利用生物细胞具有重要意义。通过细胞建模和计算分析,不仅可以获得有效的代谢改造策略以实现将细胞改造成高效“化工厂”的目的,同时也能深入理解生命机器的运作机制,并从中获得启发。而具有深厚研究背景的模式微生物便成为探讨复杂的生命细胞代谢网络的一个着手点。自从进入基因组时代以来,模式微生物的全基因组代谢网络模型和基于该类模型的分析预测算法得到了突飞猛进的发展。研究人员不断开发新的方法使得代谢网络模型能尽可能描述细胞的真实状态,而基于代谢网络模型的应用也层出不穷。然而,该领域有很多基础性的问题尚未解决,如许多代谢模型的质量有待提升,却没有一种高效而系统的模型纠错算法。关于细胞生长的预测有大量的相关文献,而利用代谢网络预测细胞死亡速率的却几乎没有。微生物细胞代谢相互作用在自然界中无处不在,而现有的预测方法却存在重大缺陷,导致往往无法预测准确。本文将针对上述基础性问题提出计算系统生物学解决方案,包括构建新模型、融合现有理论并开发新算法。
本文的主体分为两部分,第一部分(第二章,即“单菌部分”)研究如何纠正现有的单菌细胞代谢模型中存在的问题,系统性评估以生产为目的代谢途径,预测代谢改造策略,并开发代谢流分析与预测软件。第二部分(第三章,即“多菌部分”)讨论如何从经济学和数学的角度理解微生物间的代谢相互作用,指出以往算法中存在的问题,开发新的算法来预测代谢互作下菌群个体的表型并剖析影响菌群成员生长的限制因素。
第一部分叙述了本人利用新建的算法biomassMW对谷氨酸棒状杆菌和莱茵衣藻全基因组代谢网络模型进行的系统性纠错,包括更正了大量质量/电荷不守恒的反应,补全模型中缺失的代谢物分子式,纠正了生物质反应中的错误,计算了生物质组成并将其标准化,从而得到了最新版本的谷氨酸棒状杆菌ATCC13032模型CG3和莱茵衣藻模型。通过和13C胞内代谢流数据比较,CG3的预测胞内代谢流均方根误差为0.43mmol/gDWh,该误差值比2009年版本模型的误差值降低99.3%。利用CG3预测高产赖氨酸的代谢改造策略,和文献中报道的成功改造策略一致。随即利用CG3设计高产脯氨酸代谢改造策略,该策略包含解除反馈抑制、下调竞争途径、加强前体供应等,合作方根据该策略进行代谢改造将脯氨酸的产量提升至约20g/L的摇瓶发酵水平和接近50g/L(7.5L,60h)的上罐发酵水平。随后介绍了一套从热力学可行性、理论得率、辅因子供求关系的角度系统性评价异源代谢途径的计算方法,并基于CG3模型,利用该方法选取了最优的生产己二酸的异源代谢途径,即以赖氨酸为前体合成己二酸。计算显示该途径和其他途径相比,在最佳工作状态下能更高效地利用还原力辅因子并减少碳流的浪费。随后以提高底盘细胞和异源途径的适配性为目的,对底盘细胞代谢改造策略进行了预测。最后通过整合上述代谢途径分析预测方法,开发了一个方便使用的模块化代谢网络分析预测软件“MST”。
第二部分建立在第一部分之上,以单菌细胞为基础构建多菌模型来研究微生物间的相互作用。细胞间的相互作用在微生物世界里无处不在,代谢物交换这种重要的微生物间的相互作用,仍然很难用实验方法测定,使得相关模拟计算研究十分重要。传统的生态模型通常缺乏代谢层面的具体信息,从而凸显了代谢网络模型在该领域的优势。然而现有的用来预测微生物群落代谢的算法通常带有“强制利他”设定,这种设定会为了满足计算上最大化的群体目标函数,而强迫一种微生物在满足自身需要前以输出代谢物的方式满足其他微生物的需要,使得预测的结果不一定为纳什均衡,同时造成巨大的预测误差。“强制利他”设定广泛存在于以往的算法中,但由于其隐蔽性,一直没被发现。于是作者开发了一个不包含“强制利他”设定的双层混合整数优化算法用来预测微生物间的代谢互作,起名为NECom。该算法预测的结果被证明均为菌间互作的纳什均衡。NECom的内层问题体现了进化的基本原理而外层去寻找纳什均衡,通过进一步的改进,使得该算法可以支持负生长速率表型(细胞死亡)的预测。同时,作者利用传统博弈论分析方法开发了一个基于影子价格的迭代型算法(FShaP)来预测代谢交互的状态转移,从而将传统博弈论方法和代谢网络模型无缝衔接起来,FShaP的计算结果表明NECom可成功预测多种经典的博弈模型的进化稳定状态(ESS),这些经典模型包括囚徒困境、合作模型以及雪堆博弈模型。随后,作者利用NECom对一个微藻-酵母混养体系进行了深入分析,求解了1200多个生长状态,并比较了3221组实验数据,结果显示,NECom在没有特设的参数下能够捕获实验大数据所揭示的趋势。和含有“强制利他”设定的代表性算法Joint-FBA相比,NECom对莱茵衣藻和酿酒酵母生长速率的预测均方根误差(RSME)分别下降了63.5%和81.7%。模拟解释了衣藻相对酵母具有显著的生长优势是因为不断下降的葡萄糖浓度和稳定的光照。该算法首次实现了生长限制性交换代谢物的预测,分析表明一个代谢互作系统能够形成稳定的群落是由于各自限制性交换代谢物的供给速率具有相反的趋势,在衣藻-酵母体系中,限制衣藻生长的交换物被确定为CO2,而限制酵母的是氨。上述结果展现了NECom预测分析真实世界的菌间相互作用的能力。本文提出的方法体系可以作为分析微生物间代谢相互作用的新的有效手段。
本文的主体分为两部分,第一部分(第二章,即“单菌部分”)研究如何纠正现有的单菌细胞代谢模型中存在的问题,系统性评估以生产为目的代谢途径,预测代谢改造策略,并开发代谢流分析与预测软件。第二部分(第三章,即“多菌部分”)讨论如何从经济学和数学的角度理解微生物间的代谢相互作用,指出以往算法中存在的问题,开发新的算法来预测代谢互作下菌群个体的表型并剖析影响菌群成员生长的限制因素。
第一部分叙述了本人利用新建的算法biomassMW对谷氨酸棒状杆菌和莱茵衣藻全基因组代谢网络模型进行的系统性纠错,包括更正了大量质量/电荷不守恒的反应,补全模型中缺失的代谢物分子式,纠正了生物质反应中的错误,计算了生物质组成并将其标准化,从而得到了最新版本的谷氨酸棒状杆菌ATCC13032模型CG3和莱茵衣藻模型。通过和13C胞内代谢流数据比较,CG3的预测胞内代谢流均方根误差为0.43mmol/gDWh,该误差值比2009年版本模型的误差值降低99.3%。利用CG3预测高产赖氨酸的代谢改造策略,和文献中报道的成功改造策略一致。随即利用CG3设计高产脯氨酸代谢改造策略,该策略包含解除反馈抑制、下调竞争途径、加强前体供应等,合作方根据该策略进行代谢改造将脯氨酸的产量提升至约20g/L的摇瓶发酵水平和接近50g/L(7.5L,60h)的上罐发酵水平。随后介绍了一套从热力学可行性、理论得率、辅因子供求关系的角度系统性评价异源代谢途径的计算方法,并基于CG3模型,利用该方法选取了最优的生产己二酸的异源代谢途径,即以赖氨酸为前体合成己二酸。计算显示该途径和其他途径相比,在最佳工作状态下能更高效地利用还原力辅因子并减少碳流的浪费。随后以提高底盘细胞和异源途径的适配性为目的,对底盘细胞代谢改造策略进行了预测。最后通过整合上述代谢途径分析预测方法,开发了一个方便使用的模块化代谢网络分析预测软件“MST”。
第二部分建立在第一部分之上,以单菌细胞为基础构建多菌模型来研究微生物间的相互作用。细胞间的相互作用在微生物世界里无处不在,代谢物交换这种重要的微生物间的相互作用,仍然很难用实验方法测定,使得相关模拟计算研究十分重要。传统的生态模型通常缺乏代谢层面的具体信息,从而凸显了代谢网络模型在该领域的优势。然而现有的用来预测微生物群落代谢的算法通常带有“强制利他”设定,这种设定会为了满足计算上最大化的群体目标函数,而强迫一种微生物在满足自身需要前以输出代谢物的方式满足其他微生物的需要,使得预测的结果不一定为纳什均衡,同时造成巨大的预测误差。“强制利他”设定广泛存在于以往的算法中,但由于其隐蔽性,一直没被发现。于是作者开发了一个不包含“强制利他”设定的双层混合整数优化算法用来预测微生物间的代谢互作,起名为NECom。该算法预测的结果被证明均为菌间互作的纳什均衡。NECom的内层问题体现了进化的基本原理而外层去寻找纳什均衡,通过进一步的改进,使得该算法可以支持负生长速率表型(细胞死亡)的预测。同时,作者利用传统博弈论分析方法开发了一个基于影子价格的迭代型算法(FShaP)来预测代谢交互的状态转移,从而将传统博弈论方法和代谢网络模型无缝衔接起来,FShaP的计算结果表明NECom可成功预测多种经典的博弈模型的进化稳定状态(ESS),这些经典模型包括囚徒困境、合作模型以及雪堆博弈模型。随后,作者利用NECom对一个微藻-酵母混养体系进行了深入分析,求解了1200多个生长状态,并比较了3221组实验数据,结果显示,NECom在没有特设的参数下能够捕获实验大数据所揭示的趋势。和含有“强制利他”设定的代表性算法Joint-FBA相比,NECom对莱茵衣藻和酿酒酵母生长速率的预测均方根误差(RSME)分别下降了63.5%和81.7%。模拟解释了衣藻相对酵母具有显著的生长优势是因为不断下降的葡萄糖浓度和稳定的光照。该算法首次实现了生长限制性交换代谢物的预测,分析表明一个代谢互作系统能够形成稳定的群落是由于各自限制性交换代谢物的供给速率具有相反的趋势,在衣藻-酵母体系中,限制衣藻生长的交换物被确定为CO2,而限制酵母的是氨。上述结果展现了NECom预测分析真实世界的菌间相互作用的能力。本文提出的方法体系可以作为分析微生物间代谢相互作用的新的有效手段。