论文部分内容阅读
西瓜(Citrullus lanatus L.)和甜瓜(Cucumis melo L.)均是世界性的园艺作物,具有重要的经济价值。细胞器基因组是一个物种全基因组的重要组成部分,研究西瓜、甜瓜细胞器(叶绿体和线粒体)基因组是继核基因组计划之后,解析西瓜、甜瓜全部遗传信息,进而实现西瓜、甜瓜分子设计育种的必经之路。目前有关西瓜、甜瓜细胞器基因组的研究较少,在一定程度上阻碍了西瓜、甜瓜基于细胞器基因组相关研究的开展。因此,对西瓜、甜瓜细胞器基因组研究具有重要的意义。本研究首先测序、拼接、组装并发表了栽培西瓜叶绿体基因组全序列,以及甜瓜线粒体基因组全序列,然后结合GenBank数据库中已经公布的基因组数据,对西瓜、甜瓜的细胞器基因组进行了全面的比较基因组学分析,主要研究内容和结果如下:1.完成并公布了首个栽培西瓜叶绿体基因组。栽培西瓜的叶绿体基因组由一个单环双链DNA分子构成,全长为156,906bp,呈典型的四段式结构,其中大单拷贝区(LSC)长86,844bp,小单拷贝区(SSC)长17,896bp,两个反向重复区(IRa和IRb)长均为26,083bp。整个基因组编码131个基因,其中包括86个蛋白编码基因、37个tRNA基因、8个rRNA基因;其基因组的结构、GC含量、基因排列顺序和密码子偏好性与其它高等植物的叶绿体基因组相似。此外,在西瓜的叶绿体基因组中存在19条串联重复序列(TR)、26对散在重复序列(DR)和53条简单重复序列(SSR),其中SSR类型多为多聚A和多聚T,主要分布于非编码区。2.提出了全新的基于高通量测序数据高效叶绿体基因组拼接策略。本研究提出了一套基于Illumina Hiseq全基因组测序数据从头组装叶绿体基因组的全新策略,无须单独分离纯化叶绿体基因组DNA,即可高效经济地获取植物叶绿体基因组完整序列,用该方法成功完成并首次公布了栽培西瓜叶绿体基因组,随后用该方法率先成功组装完成了药西瓜(Citrullus colocynthis)、热迷西瓜(Citrullus rehmii)、阿玛鲁西瓜(Citrullus amarus)等3个野生种西瓜,以及中国南瓜(Cucurbita moschata)、印度南瓜(Cucurbita maxima)、苦瓜(Momordica charantia)和葫芦(Lagenaria siceraria)等4个葫芦科植物的叶绿体参考基因组,再次验证该方法的良好通用性和实用性。基于15个葫芦科植物的叶绿体全基因组序列的比较基因组学分析发现,葫芦科植物的叶绿体基因组均为单环双链DNA分子,GC含量与西瓜相似,均在36.737.2%,全基因组长度约为155159kb,平均长度约为157kb,编码基因数量为130133个,平均有131个基因;叶绿体基因组之间整体的共线性比较好,没有发生重排现象。此外,我们基于15个葫芦科植物的叶绿体基因组序列的比对结果,开发了适用于葫芦科内物种鉴定、系统进化和群体遗传等相关研究的7个DNA barcoding和38个SSR标记,用叶绿体全基因组序列进行系统进化关系分析,可以得到与核基因组分析相似的结果。3.完成并公布了首个甜瓜线粒体全基因组完整序列。本研究利用具有读长优势的三代测序技术PacBio Sequel测序数据用于甜瓜线粒体基因组研究,成功完成并公布了葫芦科植物中序列最长的甜瓜线粒体基因组完整序列,该基因组由3个环状的DNA分子组成,主环长度为2,709,526bp,其余两个小环,长度分别为149,555bp和47,592bp,基因组总长约为2.9Mb(2,906,673bp),GC含量为44.77%,高于甜瓜细胞核基因组和叶绿体基因组的GC的含量。该基因组编码了88个基因,包含40个蛋白编码基因,8个rRNA基因和40个tRNA基因,其中所有蛋白编码基因全部分布于主环上,仅有5个tRNA基因分布于第二个小环上,第三个小环上没有任何编码基因。非编码基因序列占甜瓜线粒体基因组的绝大部分,其百分比值为98.32%。甜瓜线粒体基因组序列与叶绿体和细胞核基因组同源序列分别为2.73%和46.47%。此外,甜瓜线粒体基因组中共有4,861对同向重复序列,439对反向重复序列,653条串联重复序列,以及218条SSR序列,重复序列的总长度约占全基因组的44.2%。对甜瓜、西瓜、黄瓜和西葫芦的线粒体基因结构特征进行深入比较分析后发现,大量的重复序列和核基因组源序列是甜瓜线粒体基因组规模不断增大和变异的主要原因,此发现为葫芦科植物线粒体基因组的遗传变异提供依据。4.将叶绿体全基因组首次应用于西瓜、甜瓜的群体结构及遗传多样性的研究。本研究分别在314份西瓜材料的西瓜自然群体和348份甜瓜材料的甜瓜自然群体内鉴别了的82个和192个叶绿体基因组SNP位点,主要分布在叶绿体基因组的LSC区和SSC区内,互为反向重复的IRa和IRb中几乎不含有SNP位点。然后用这些SNP位点分析了西瓜、甜瓜自然群体的群体结构,并对每个群体的果实相关性状和群体遗传多样性进行深入分析,结果表明82个SNP能有效地将西瓜自然群体分为4个群体:野生毛西瓜群、半野生黏籽西瓜群、美洲生态型栽培西瓜群和亚洲生态型栽培西瓜群,其遗传多样性(π值)依次下降,分别为6.6×10-5,2.4×10-5,9.8×10-6和5.41×10-6,野生毛西瓜群的单果重、可溶性固形物、果肉颜色和种子千粒重与其它三个群有显著的差异。192个SNP能有效地将甜瓜自然群体分为3个群体:野生小甜瓜群、厚皮型栽培甜瓜群和薄皮型栽培甜瓜群,其遗传多样性也依次下降,分别为1.12×10-3、4.71×10-4和2.85×10-4,三个群体之间的果肉厚度有显著差异。这些研究结果表明叶绿体全基因组可用于西瓜和甜瓜的群体遗传学研究,有助于种内亚群之间的分类和核心种质资源鉴定等研究。本研究发表的首个栽培西瓜叶绿体参考基因组及首个甜瓜线粒体参考基因组,所构建的叶绿体基因组从头拼接全新策略及开发的适用于葫芦科植物研究的DNA barcoding和SSR分子标记,将为今后西瓜、甜瓜系统进化、物种鉴定、群体遗传、核质互作、RNA编辑、基因工程等基于叶绿体和线粒体基因组的相关研究提供理论依据。