论文部分内容阅读
生物系统是复杂系统,系统中各种组分包括核酸、蛋白质和小分子化合物相互作用构成复杂的关系网络。使用复杂性理论中的网络分析方法能够从全局上分析各组分间的作用关系以及整个系统的结构和行为特点。高通量技术的发展与计算机计算和存储能力的提高,使从基因组水平上构建和分析各类生物分子网络成为可能。原核生物中的模式生物枯草芽孢杆菌(Bacillus subtilis)具有较强的代表性和重要的基础科学研究价值,因此本文构建了枯草芽孢杆菌的基因调控网络,并使用复杂网络的理论对其做进一步分析。随着对枯草芽孢杆菌研究的不断深入,其生物学数据不断丰富,出现了如SubtiList、BsubCyc和DBTBS等重要专题数据库。其中BsubCyc整合了枯草芽孢杆菌多方面信息,如基因组、蛋白质、代谢反应、调控信息等,具有全面系统性。但其存储格式为平面文件,无法满足用户个性化需求。因此本文根据其数据结构,设计了 MySQL数据库,使用计算机和人工结合的方法将原数据转化后导入MySQL数据库并进一步整合完善,最终得到的枯草芽孢杆菌MySQL生物学数据库包括114个表,其中有20个主表和94个从表。整个数据库充分保留了BsubCyc原有数据,并根据MySQL工作特点提高了数据存储和使用效率。文中以构建所得MySQL生物学数据库和最新DBTBS数据库为数据来源,通过提取整合数据库中的调节基因、靶标基因和调控模式等调控信息,构建了枯草芽孢杆菌基因调控网络,其中包括1515个基因和2348条调控关系。整个基因调控网络分为21个弱连通体,并以最大弱连通体为研究对象,分离并探讨了 6个强连通体的功能作用主要涉及孢子形成过程的调控。对网络的度分布分析表明,基因调控网络的出度和整体度分布近似服从幂律分布,具有无标度性,而入度分布服从指数分布。通过与随机网络和其他真实小世界网络进行对比,认为文中的基因调控网络表现出明显的小世界特征,具有高的聚类系数和小的特征路径长度。接下来使用Barabasi等提出的层次网络分析方法,探讨了基因调控网络中聚类系数C(k)与k的关系,通过直线拟合得到其幂指数b非常接近于完全分层网络的值(b=1),表明基因调控网络是一个分层网络。然后使用Gerstein等提出的方法将网络分为三层,对各层基因的分析发现中间层基因在传播调控信息中处于重要瓶颈地位。文中最后使用FANMOD软件搜索了基因调控网络中的3阶和4阶模体,并发现前馈环和双扇两类主要的网络模体。