论文部分内容阅读
以往研究者认为生物仅通过DNA水平遗传信息的改变来应对环境变化,而RNA只是作为基因与蛋白质之间的过渡,并不涉及到遗传信息的改变。直到近几年,测序技术的革命性突破让人们观察到了mRNA可变剪切在基因组中广泛存在,并且能够在不改变基因组DNA的情况下,改变最终的蛋白质产物,从而增加生物的多样性。既然群体核苷酸多样性与可变剪切两者都能够增加蛋白质的多样性从而提高生物对环境的适应性,那么这两者之间有没有什么联系呢?得益于大量二代测序数据的涌现,对该问题进行了研究。 首先以对可变外显子与组成性外显子的保守性分析为出发点,发现可变剪切基因的群体核苷酸多样性显著低于非可变剪切基因。接下来,通过公共数据库注释的可变剪切信息与来自于多个组织的转录组数据的可变剪切信息,在多个物种中观察到可变剪切与群体核苷酸多样性呈负相关性。 由于之前的研究提到基因的形成时间和功能与可变剪切数量密切相关,分别分析了这两者对负相关性的影响,证明了负相关性不是由于基因的形成时间或功能分类导致的,验证了可变剪切与群体核苷酸多样性的负相关性存在的真实性。 最后,对可变剪切与核苷酸多态性的负相关性形成机制进行了探讨。通过对可变外显子与组成性外显子两侧内含子的核苷酸差异度进行分析,检测到可变外显子两侧的内含子序列多态性更低,证明了是正选择作用于可变外显子,并通过扫荡性选择,大大降低了可变外显子周围序列的多态性,造成了可变剪切与群体核苷酸多样性的负相关性。 在对可变剪切与群体内核苷酸多样性关系的研究过程中,通过方法学上的创新自主开发了一套群体基因组比对体系——Easy Genome Aligner,并建立了一个界面友好的在线数据分析平台。该网站的两个主要功能分别是进行多基因组比对和基因组内部的旁系同源序列的鉴定,此外,为了满足用户对于数据和计算量的不同需求,还提供了一个全功能的本地的虚拟机,用于较大规模数据的计算。为了帮助用户从比对结果中更直观的提取重要的生物学信息,在结果输出方面,不仅提供了基础的结果文件,还提供了一系列关于基因组变异的分析报告。综上所述,EGA是一个面向广大生物研究者的、友好、高效的多基因组比对网站,并且能够尽可能的使用户摆脱繁琐的技术问题,提炼出具有生物学意义的结果。