论文部分内容阅读
比较基因组学是研究不同物种间相互关系的重要方法,它以基于序列相似性的比对和同源聚类为基础。目前用于比较基因组学研究的工具有许多,BLAST始终是其中使用最广泛和有效的工具。它在序列查询、比对、基因组拼接、同源聚类、直系与旁系同源的识别等各个方面都有重要应用。基于BLAST的同源聚类是后续一系列比较基因组学分析的重要基础,包括核心基因与物种特异性基因的识别、基因组进化分析、基因获得与丢失预测等等。虽然每一步分析工作都有工具可以实现,没有一个工具提供一个整合且友好的分析环境。
本研究采用Java语言开发了一个基于BLAST和马尔可夫聚类(Markov Clustering)等图算法的比较基因组学工具----BlastGraph,实现了这一需求。更重要的是,该工具具有如下优势:通过图形化显示聚类提供了聚类结果的校对和评价,采用更灵活的分析方法实现了远缘同源基因的识别,提供了多种方法实现基因组进化树的构建,实现了基因获得和丢失预测结果的图形化显示。同时,本文使用该工具对杆状病毒(Baculovirus)进行了研究。杆状病毒是一类杆状的特异性感染节肢动物的大型双链DNA病毒(Large dsDNA Virus),它在农业病虫害防治、真核基因表达系统、基因治疗载体等方面具有重要应用。使用BlastGraph对杆状病毒进行聚类分析,我们发现polyhedron&granulin、pep和Ac106&Ac107可能是三个新的核心基因。基因组进化树分析结果显示杆状病毒基因内容的进化和序列点突变的进化是一致的。基因获得和丢失模式表明杆状病毒在进化过程中,其基因组内容不断膨胀;对其杆状病毒祖先基因组状态的预测表明,杆状病毒最初的基因只能使其以包涵体的形式存在,感染中肠等组织细胞;其从宿主或其它地方获得的外源基因,逐渐使其能以芽苞的形式感染其他细胞,并建立系统感染,促进其更好地适应和感染宿主。图22幅,表5个,参考文献72篇。