论文部分内容阅读
由于自然选择作用的放松,在家畜快速繁育过程中,一些种用个体会从头发生突变,从而向家畜群体引入潜在的遗传疾病和缺陷。因此,明确家畜基因组中的关键保守区域,并理解在该区域发生位点突变的规律以及预测其是否会影响家畜的生物学功能尤为重要。而基因组上在整个哺乳动物进化过程中区域和位点的保守性,是重要功能元件的有力标志。它们保持不变可能有助于行使物种的基本生命活动和适应性功能,特别是超保守元件。某些超保守元件在特定支系中发生加速进化,其是否有助于适应性进化仍存在争议。其次,这些重要的保守区域是否存在影响家畜选育的变异位点尚不清楚。本研究利用从NCBI下载已发表的95个哺乳动物基因组,通过重建祖先序列来获取超保守元件。对超保守元件以及其在山羊群体中的变异进行了分析,得到如下结果:1、根据构建的哺乳动物系统发育树,将哺乳动物分为8个分支:偶蹄目、翼手目、食虫目、奇蹄目、食肉目、啮齿类、灵长类、非洲总目。超保守元件定义为在至少一个分支中存在与祖先序列完全一致且长度大于200bp,并在其他分支与祖先序列相似度大于80%的序列。最终鉴定了2,191个哺乳动物超保守元件。其中1,196个超保守元件在至少两个支系与祖先序列一致,只有48个超保守元件在所有支系与祖先序列都一致。还将哺乳动物超保守元件比对到其他脊椎动物基因组上,大约有80%以上存在于羊膜动物中,一半存在于四足类,大约只有30%存在于有颌类,而在分歧时间更早的七鳃鳗和盲鳗中,几乎已经不存在哺乳动物超保守元件。可以看到超保守元件在羊膜动物、四足类以及有颌类都出现了明显的扩张。另外,有163个超保守元件与反刍动物高保守元件重叠。2、根据人基因注释,通过对超保守元件的位置分布分析,表明哺乳动物超保守元件主要分布于非编码区。34.9%位于内含子区,25.8%位于基因间区。同时,对已发表的55个来自人11个不同组织的转录组数据分析显示,超保守元件的邻近基因表达更稳定并且倾向于在各组织中广泛表达。另外,超保守元件邻近基因的KEGG通路富集主要集中在癌症、神经、剪切以及生理节律等相关功能。3、为了探索超保守元件的可变性,计算了在特定支系发生加速进化的超保守元件。发现0.59%-13.2%的超保守元件在特定哺乳动物支系中加速进化,其中加速进化最多的是翼手目。另外,结果显示即使是在所有哺乳动物支系都保守的超保守元件,依然在特定物种中存在突变。在不同分支中GC偏好性基因转换(gBGC)驱动超保守元件的加速进化比例为27.3%-62.1%。并且存在gBGC在哺乳动物祖先中被选择下来。因此,发生gBGC驱动的加速进化保守元件可能促进了物种适应性进化,在家畜中超保守元件发生gBGC改变,可能并不影响其基本功能。4、基于对山羊群体内SNPs在超保守元件上的分析表明,超保守元件上的SNPs分布率更低且大多数都是低频的。这些发生在具有重要作用的超保守区域的低频变异可能对家畜健康造成潜在威胁,因此,在家畜选育时应尽量避免。此外,我们发现位于超保守元件上的12个SNPs在野生群体中频率为0,但在不同家养群体中具有一定频率分布,且位于反刍动物高保守元件上。其中3个都位于SPATA17基因的内含子区,该基因在睾丸中特异表达且与精子发生相关,因此,SPATA17基因在家畜选育的过程中可能具有一定作用。这些位于超保守元件上的SNPs或许能够为种公羊的选择提供指导。综上所述,本研究利用大量哺乳动物基因组、转录组数据,旨在探究超保守元件在基因组上的特性,以及gBGC驱动超保守元件加速进化的作用,并为家畜的选育提供了新思路。