论文部分内容阅读
油菜作为食用植物油和饲用蛋白质最主要的来源之一,在国民经济和人们生活中具有非常重要的地位。甘蓝型油菜(Brassica napus L.)是我国最主要的栽培油菜类型,它是由白菜(Brassica rapa L.)和甘蓝(Brassica oleracea L.)在大约7,500年前经历自然杂交及随后的基因组加倍而形成。全基因组测序结果显示,甘蓝型油菜中An、Cn亚基因组同源区域序列相似度约为92%,基因编码区的序列一致性高达95%以上。而目前主流的基于第二代测序数据、全基因组水平的序列变异检测工具基本都是针对二倍体物种开发和优化的。因此本研究的第一个目标是通过综合比较当前主流的单碱基变异检测软件的灵敏度和准确率,探索一套适用于甘蓝型油菜的SNP检测流程。利用SNP作为标记研究作物进化与驯化也是作物基因组学研究的常用方法。多个异源多倍体物种的研究表明,异源多倍体物种的亚基因组之间呈现了不对称的现象,为了进一步验证此类现象是否也存在于甘蓝型油菜中,本研究的第二个目标是通过群体遗传学分析验证甘蓝型油菜亚基因组不对称现象。基因组多倍化后,核内物质(以染色体总长度计)近乎加倍,而细胞核空间增长非常有限,物种进化过程中核内物质含量和细胞核直径增长不一致是否与基因组三维结构有关?异源多倍体各亚基因组间的染色质空间组织是否存在一些新的组织形式?如果存在新的组织形式,其组织形式是否与基因组变异有关?诸如之类的问题一直是本课题组关注的重点。因此,本研究的第三个目标是分析甘蓝型油菜基因组三维空间结构特征及其与基因组变异的关系。本研究的主要结果如下:1.甘蓝型油菜SNP检测方法比较本研究基于100份模拟的不同测序深度(7×、15×和30×)的甘蓝型油菜重测序数据,对VarScan、BCFtools、GATK和sentieon四个工具在变异检测的时间消耗、灵敏度和精确率方面进行了系统的比较分析。主要结果为:在时间消耗方面,总体上sentieon表现最优,在7x测序深度下,其他3个工具分别是sentieon的约30、37和91倍。在鉴定灵敏度及准确率方面,VarScan和BCFtools的鉴定质量受测序深度影响较大,而GATK和sentieon在不同深度下表现比较稳定。GATK与sentieon在不同深度下均表现得比较出色,sentieon软件为追求最短的时间消耗,其灵敏度略低于GATK,但是其准确率在低深度测序条件下比GATK更高。2.甘蓝型油菜自然群体的SNP鉴定及分析基于上述SNP检测方法的比较结果,本研究选用sentieon对419份甘蓝型油菜群体的测序深度约为7.3×的高通量测序数据进行了SNP鉴定,并进行了多方面的验证。结果显示:SNP在全基因组上的分布密度为4.51/kb,其中An亚基因组的SNP密度(5.64/kb)大于Cn亚基因组(3.85/kb)。利用此SNP分析群体结构发现,419份甘蓝型油菜群体能被清晰准确地分为半冬性油菜、冬油菜、春油菜和人工合成油菜4个亚群。进一步分析该群体的连锁不平衡(Linkage Disequilibrium,LD)衰减水平发现,该群体的LD衰减距离为15.7 kb(r~2=0.28),其中An的LD衰减距离(4.1 kb,r~2=0.26)远远小于Cn的LD衰减距离(43.7 kb,r~2=0.29)。最后,利用324材料中收集的25个表型,本研究对该群体展开了全基因组关联分析。结果显示,25个表型中有22个表型的显著关联SNP标记更趋向于分布在An亚基因组上。3.甘蓝型油菜基因组三维结构及其与变异的关系分析为了探究甘蓝型油菜基因组三维空间结构特征及其与基因组变异的关系,本研究利用高通量染色质构象捕获技术(Hi-C)测定了甘蓝型油菜品系Darmor-bzh的全基因组染色质交互数据并构建了高质量的甘蓝型油菜基因组交互矩阵。然后,在此基础上分析了甘蓝型油菜的基因组空间组织特征及其与SNP之间的关系。结果显示:甘蓝型油菜An、Cn亚基因组间三维空间结构呈现出显著的差异,主要表现在:1)An亚基因组的交互衰减指数显著低于Cn亚基因组;2)An亚基因组交互显著强于Cn亚基因组;3)An亚基因组比Cn亚基因组压缩的更加紧实,An的染色体间交互显著高于Cn亚基因组;4)甘蓝型油菜亚基因组在空间位置上并不是均匀地分布的,而是在亚基因组之间产生了一定的位置偏好性。更进一步的分析结果显示,甘蓝型油菜染色体间交互和SNP及重要性状相关遗传位点数目呈现极显著的正相关(p<1e-5,Pearson’s r>0.9)。结合人类、小鼠等模式物种中“染色质开放程度可影响DNA突变及基因组结构变异”的相关研究结论以及“结构决定功能”等生物学一般性规律,本研究初步认为:甘蓝型油菜基因组三维结构在An、Cn亚基因组上呈现的不对称现象可能导致了群体水平的SNP及功能遗传位点的分布不对称。本文的探索性研究为进一步挖掘甘蓝型油菜等多倍体物种中亚基因组不对称的驱动机制提供了新的思路和方向。