论文部分内容阅读
鸟类的进化总是伴随着基因序列的变化,从始祖鸟到如今上万种鸟类,基因序列不断发生着改变,这些序列的改变影响着鸟类的形态,对不同食物的摄入以及对不同生存环境的适应。此外,鸟类在形态上也具有保守性,如:如具有羽毛覆盖的翅膀,流线型的躯体,鸟喙以及飞行能力。 为了研究这些保守性的遗传性基础,本研究自创了鉴定超保守元件的流程,该流程中利用94种鸟类的基因组构建了鸟类祖先基因组序列并提取四倍简并位点构建了系统发育树,然后将这些基因组模拟成片段比对到祖先基因组上,接着将相似度大于90%的区域提取出来,并将其重新比对到94种鸟类的基因组上,最后根据构树结果,选取在两个以上支系完全比对上且在其他支系相似度大于80%的区域构成鸟类超保守元件的集合。 根据该流程鉴定了鸟类的超保守元件,首先分析了超保守元件在基因组上的分布情况,15.6%的超保守元件位于外显子上,37.7%位于内含子上,36.8%位于基因间区,7.9%则位于UTR区。另外,对鸟类超保守元件集合的保守性做了评估:通过将该集合内的序列比对到其他脊索动物如哺乳动物的基因组中,结果发现比对到与鸟类亲缘关系近的物种上的超保守元件更多。根据比较鸟类超保守元件与鸡全基因组水平的SNP以及结合鸟类超保守元件与鸡相对于火鸡的差异位点的的分析结果,发现鸟类超保守元件与鸡的全基因组SNP分布情况区别不大,而鸟类超保守元件的差异位点的丰度要显著的低于整个基因组的丰度,说明了元件的超保守性是由于受到强选择而不是因为这些元件处于突变的“冷区”。为了研究超保守元件在不同组织中表达量的差异,所以进行了转录组表达量变异系数CV值以及τ值分析,结果同样显示超保守元件相对全基因组在不同组织的表达量差异更小。 其次为了研究鸟类形态上的保守性,对基因组上距离超保守元件最近的基因做了功能富集分析,结果显示这些元件在个体发育以及表达调控上得到显著性富集,由此推测这些个体发育的超保守元件可能是导致鸟类形态保守性的原因。 最后由于在鸡形目、水鸟类以及雀形目上发生加速进化的超保守元件中发现这些元件存在GC偏好性的碱基替换事件。为了探究gBGC是否驱动超保守元件的加速进化,本研究通过统计碱基替换的个数再对统计结果Storer–Kim检验的方法鉴定出由gBGC引起的加速进化,结果显示31%-36%的加速进化是由gBGC引起的,因此认为gBGC是驱动鸟类超保守元件加速进化的主要因素。 通过本研究对鸟类超保守元件的分析,揭示了鸟类超保守元件的数量分布以及保守性来源,提出了鸟类形态保守性的可能解释,为研究鸟类适应性进化提供了可选的研究方向。为研究鸟类超保守元件生物学功能提供了数据支持以及理论依据。