论文部分内容阅读
随着物种基因组测序的完成以及大量生物学数据的产生,基因组规模代谢网络模型已经成为系统生物学不可或缺的研究工具。而模型构建的速度远远跟不上测序的速度,造成这种情况的原因除了对很多物种生理生化机制了解较少之外,更重要的是重构代谢网络过程需要大量人工工作,非常耗时耗力。因此,代谢网络重构的自动化研究成为推动代谢网络发展的关键因素。此外,最简基因组是合成生物学的研究热点之一,基因组简化细胞将为生物技术的应用提供理想的底盘细胞。通过计算机辅助的基因组最简化模拟与分析,能够在最简化基因组的同时又不对细胞生长产生影响,最终得到一套预测的细胞正常生长状态下的包含最简基因的代谢途径,为目的生物获得最简基因组的湿实验设计提供参考。上述运用计算机语言辅助实现的自动化构建与最简基因组的研究均在树干毕赤酵母基因组规模代谢网络模型重构过程中得到运用实施。主要研究结果如下:⑴以构建树干毕赤酵母CBS6054的基因组规模代谢网络模型为例,以简单、面向对象的Java语言为基础,Perl语言辅助,对代谢网络自动化重构的方法进行了研究,提出了一种基于KEGG在线数据库来自动化构建初模型的方法,并对基于Uniprot-MetaCyc本地数据库以及亲缘物种同源比对构建初模型的方法以及整合过程进行了自动化研究,提出了基于反应式字符频度直方图的欧氏距离比对算法,并应用于模型整合和模型核心反应的识别,对于提高模型构建效率意义重大。⑵在自动化整合后的模型基础上,结合文献数据,通过Matlab中COBRA工具箱函数对转化的数学模型进行调试修正,最终得到树干毕赤酵母基因组规模代谢网络模型iWC978。该模型包含1585个反应、1145个代谢物和978个基因,分布于线粒体、过氧化物酶体、内质网、高尔基体、液泡、细胞核、细胞质和胞外8个细胞区室。模型注释的功能基因组开放阅读框覆盖率达到16.8%。模型中的代谢反应划分为62个代谢途径,分别对应于8个细胞亚系统中。⑶对模型数据进行了碳源利用和乙醇发酵等生长表型的模拟分析,FBA结果分析表明:模型可以利用葡萄糖、木糖、鼠李糖、纤维二糖、D-甘露糖、L-阿拉伯糖、D-半乳糖、木糖醇等碳源生长;在限制氧气条件下,可发酵葡萄糖、木糖、纤维二糖、D-甘露糖、D-半乳糖进行乙醇生产,鼠李糖、L-阿拉伯糖与木糖醇为不可发酵碳源。结果与文献报道的相符合,符合树干毕赤酵母的生理特性,说明构建出的模型的有效性。⑷以构建出的模型数据出发,按照“自上而下”研究思路,运用遗传算法多目标思想,设计程序编写语言最终获得了树干毕赤酵母以葡萄糖为唯一碳源生长的最简基因组,分析结果表明,模型简化符合生物学特征与生理特性。