论文部分内容阅读
本论文可分为两个主题三个课题:一个主题为多个生物体的基因预测,第一、二个课题属于此部分;另一个主题为氨基酸基因注释,第三个课题属于此部分。第一个课题重新注释和修订了Pyrobaculum aerophilum str.IM2基因组。注释过程可分为三部分,首先也最重要的是联合相似性搜索方法和五个从头基因预测软件新注释了二十三个最初注释文件中缺失的基因。在这些新基因中,有五个与已知功能的基因具有显著相似性。其次是应用Z曲线方法检查1645个假定开放式阅读框序列的编码能力并确定其中有二十个为非编码序列。该方法使用三十三个Z变量,达到了99.68%的精度。此后联合文献和最新数据库重新修订了八十个假定开放式阅读框序列,并通过同源比对和相似性搜索为它们注释了明确的功能。重新注释不仅为该物种相关的研究提供了更为准确的数据,还可供其他古细菌基因组注释参考。第二:个是针对脑膜炎奈瑟氏菌群C的基因组全面预测其潜在的药靶基因。重新注释的新基因,必需基因,高表达基因和基因组岛基因等都可能是药靶基因。本文将这些基因与奈瑟氏菌、人类和有益肠道菌基因组进行同源性比对后剩下120个潜在的药靶基因。通过与Drugbank和VFDB等数据库中的药靶基因和致病因子进行同源性比对来进行优化。进一步预测亚细胞位置后,确定了十八个高度可信的药靶基因,其中一个是新基因,三个是必需基因,三个是基因组岛基因且是高表达基因。这十八个中有六个亚细胞位置预测为外膜。该药靶基因预测较为全面,可为其他基因组药靶预测所参考。第三个是研究多个基因组内的tRNA基因和氨基酸组成间关系。通过分析17个古细菌、359个细菌和34个真核生物基因组数据发现两者之间存在共变关系。接下来对影响该共变关系的因素进行了分析,首先是分析基因组成、GC含量、基因组大小和转运RNA数目等基因组成类因素对其的影响,其次分析表达水平类因素对该共变关系的影响。最终明确了基因组成类因素对该共变关系具有显著影响。而基因表达对该共变关系的影响并不明显。