论文部分内容阅读
拷贝数变异(copy number variation,CNV)是生物基因组重要的变异之一,涉及基因组上拷贝数的增减。拷贝数变异对物种生命活动起到了重要作用,是物种进化过程中的重要一环。牛、山羊、绵羊等重要的反刍家畜,伴随着人类文明的发展,在人类生产生活中扮演了重要角色。通过研究这些典型物种基因组内的拷贝数变异情况为反刍动物遗传资源的保护和优良性状的开发利用奠定了理论基础。物种在复杂的进化过程中伴随着对环境的适应性变化,在拷贝数变异层面探究反刍动物对环境的适应情况仍有待探究。物种间共享一定数量的拷贝数变异,其在进化过程中的发生和保留是一个十分有趣的科学问题。拷贝数变异在功能上的重要作用是毋庸置疑的,本研究在山羊的拷贝数变异集合中,发现了位于MUC6基因一处246 bp的拷贝数变异区域(copy number variation region,CNVR),推测可能与山羊早期驯化过程中的免疫功能改变相关,探究这一重要CNVR的功能对于理解拷贝数变异在生物体中的重要作用提供了有力证据。本研究对以上生物学问题进行了解析。本研究共涉及866个样本的二代重测序数据,具体如下:(1)牛233个数据,包括140头普通牛(Bos taurus),82头瘤牛(B.indicus),11头杂交牛(B.taurus×B.indicus hybrid);(2)山羊241个数据,包括210只家山羊(Capra hircus),24只伊朗野羊(C.aegagrus),7只欧洲北山羊(C.ibex);(3)绵羊412个数据,包括387只家绵羊(Ovis aries),17只摩弗伦羊(O.musimon),3只盘羊(O.ammon),3只大角羊(O.canadensis)和2只白大角羊(O.dalli);以及一头杂交牛,一只家山羊和一只家绵羊的三代重测序数据;同时还下载了一头普通牛和一头瘤牛的单倍体基因组。通过以上重测序数据和基因组数据,利用群体遗传学和比较基因组学方法结合流行病学和人工感染试验分析得到了如下结果:1.通过基因组学对多样本的分析,以及CNVplex和q PCR验证,获得了高质量的牛、山羊、绵羊的全基因组拷贝数变异数据集合,并得到了二代和三代拷贝数变异数据集合的筛选标准。三个集合的群体遗传多样性丰富,与前人在SNP的研究结果相符。同时发现了许多品种特有的拷贝数变异。在集合中,本研究发现了拷贝数变异相比于随机分布有富集在外显子区域的趋势(p<0.00001),位于外显子的CNVR比例近50%。2.通过群体分化分析,本研究发现了共830个在群体间高度分化(VST≥0.5)的拷贝数变异位点,基因注释和富集分析显示这些位点与物种的代谢等多种重要的生命过程相关;通过与气候因子的全基因组关联分析,分别在牛、山羊、绵羊中找到了11,26,16个显著性的拷贝数变异位点。这些位点均显示了选择作用下反刍动物对环境的适应性变化。3.本研究比较了物种间共享的CNVR和单核苷酸多态性(single nucleotide polymorphism,SNP),发现种间共享的CNVR的比例远高于种间共享的SNP(p<0.00001),种间共享CNVR相比于种间共享SNP受到物种分歧时间的影响可能更小而更易保留;计算模拟研究表明种间实际共享CNVR的比例远高于随机(p<0.01);进一步探究发现,CNV热点(hotspot)对种间共享CNVR的形成机制影响很小,而且,种间共享CNVR的形成和保留,更可能受到平衡选择和趋同进化的影响。4.基于流行病学调查和人工感染试验,本研究对位于山羊MUC6的一个重要的拷贝数变异的功能进行了探究,基于流行病学调查认为家羊中频率较高的MUC6D单倍型相比于野生祖先中频率较高的MUC6B单倍型具有更高的胃肠道寄生虫抗性;人工感染试验并未成功,推测失败原因可能与山羊的自愈性、环境、虫体活力等多方面因素的复杂性相关。但总体而言,本研究证明了位于山羊MUC6功能区的重要CNVR对胃肠道寄生虫的免疫抗性作用,推测在山羊的早期驯化过程中起到了重要作用,但是其具体的分子机制还需要进一步探究。本研究通过群体遗传学和比较基因组学的方法,提供了牛、山羊、绵羊等反刍动物的拷贝数变异数据集合,有利于指导遗传育种工作,找寻物种对环境的适应性进化机制;同时,通过流行病学调查等方式对山羊免疫相关的一个重要基因的拷贝数变异进行了验证,揭示山羊MUC6基因的CNVR可能在其驯化初期,对胃肠道寄生虫的免疫作用,为山羊的抗病育种提供了理论和技术依据,同时为促进我国山羊业的健康和快速发展做出贡献。