论文部分内容阅读
线粒体是细胞中重要的细胞器,它拥有自己的遗传物质,即线粒体基因组。植物线粒体基因组在所有生物中是最大的,大小在200-2400kb。大量的研究表明线粒体基因组参与了核质互作的雄性不育(cytoplasmic male sterility,CMS)的过程。CMS在植物杂种优势利用方面具有极其重要的意义。目前普遍认为CMS是线粒体基因组的重排所引起的,线粒体基因组的重排形成一些所谓的“嵌合基因”。这些“嵌合基因”直接或间接影响线粒体正常生理功能,从而导致花粉败育。线粒体全基因组序列信息能够使我们更好的研究线粒体基因组的组成,基因的表达以及探讨线粒体基因组的分子进化和CMS的分子机理。小麦K型CMS没有不良的细胞质效应,且恢复源广,不需培育特殊的恢复系,因而被广泛使用。
本论文以解析K型雄性不育的分子机理为目的,构建了豫麦3号K型小麦雄性不育系线粒体基因组和保持系线粒体基因组的BAC文库和物理图谱,并以此为基础进行测序获得了两个基因组的全基因组序列,对两个基因组的组成和结构进行了比较分析。主要研究结果如下:
1、构建了K型小麦保持系线粒体基因组和不育系线粒体基因组的BAC文库和物理图谱
本研究以plndigoBAC-5/BamHI为载体,构建了K型小麦保持系线粒体基因组和不育系线粒体基因组的BAC文库。每个文库均分别装配了26块384孔培养板,两个文库共有约2万个克隆。对每个文库随机挑取的10个阳性克隆进行的NotⅠ酶切分析表明保持系和不育系线粒体基因组文库克隆的平均插入片段大小约分别为25kb和20kb。理论上,两个文库已经分别完全覆盖了整个小麦保持系和不育系线粒体基因组。此外,以2×2的阵式将每个文库8块384孔培养板的克隆制成了高密度尼龙膜。从小麦保持系和不育系线粒体基因组分别筛选了25个和37个克隆,构建了两者片段重叠群。
2、K型小麦保持系线粒体基因组和不育系线粒体基因组的组成
对K型小麦保持系线粒体基因组和不育系线粒体基因组分别进行测序。豫麦3号保持系线粒体基因组序列全长为452,526bp,平均G+C%含量为44%,包含35个已知的蛋白编码基因,3个rRNA和17个tRNA基因,同时还预测了149个长度大于300bp的ORF,与已经发表中国春线粒体基因组的序列高度相似,在序列上仅存在7个SNP和10个InDels(插入和缺失)的差异。不育系线粒体基因组序列全长为647,559bp,G+C的平均含量为44.3%,含有几个大的重复拷贝,其中4个重复序列长度大于10kb。其中含有53个编码基因(编码34种已知蛋白、3种核糖体RNA和16个tRNA)。同时还发现22个Ⅱ类内含子和248个长于300bp的开放阅读框(ORFs)。可识别的线粒体基因、ORFs占约192031bp,占线粒体基因组的29.6%。线粒体基因组中与叶绿体DNA同源的占据到3.2%,长度为20733bp。
3、K型小麦保持系线粒体基因组和不育系线粒体基因组的比较分析与细胞质雄性不育的候选基因
通过对小麦不育系线粒体基因组与保持系线粒体基因组比较,我们发现了37个长度大于100bp的不育系线粒体特有的DNA片段,总长为73344bp,占到整个不育系线粒体基因组序列的11.3%。14个DNA片段在数据库中不存在任何相似的序列,这些序列总长为14626bp,占到基因组总长的2.3%,剩余23个DNA片段部分或完全与数据库中的序列存在着相似性。小麦保持系和小麦不育系线粒体的大部分基因是非常保守的,序列完全一致,但也有些基因的碱基发生了变异,小麦不育系14个己知线粒体蛋白编码基因中存在34个单核苷酸多态性(SNP)。此外,atp6,nad9和nad6在保持系与不育系线粒体基因中变异较大,rpl5在小麦不育系线粒体基因组中缺失。与小麦保持系线粒体基因组相比,小麦不育系线粒体基因组含有22个特有的ORF,它们可能是细胞质雄性不育基因的候选基因。
4、植物线粒体基因组比较及进化分析
MultiPip比对表明,不育系小麦线粒体DNA与水稻,玉米等其它线粒体基因组的序列相似性分别为34.6%和32.2%,与油菜和拟南芥的线粒体分别有15.6%和15.5%的序列基因组相似性,这些相似性区域主要位于编码区。我们对几个已测序的高等植物的线粒体基因组进行比较,发现被子植物中超过一半的线粒体垂直同源基因有较高的Ka/Ks,这表明被子植物的线粒体基因发生了快速进化。当对正选择检验分析时,发现结果并不显著。因此我们认为正选择并不是被子植物线粒体基因组快速进化的主要因素。选择压力的放松可能对于被子植物线粒体基因组的进化起到了主要的作用。