论文部分内容阅读
突变体在水稻功能基因组研究中具有重要的作用,创造基因功能缺失突变体是研究目的基因功能的最直观和有效的途径之一。T-DNA侧翼序列的分离对水稻T-DNA插入突变体库的应用至关重要。一方面,我们可以根据大量的T-DNA侧翼序列来分析T-DNA在水稻基因组中的分布规律,进而明晰农杆菌介导的T-DNA转化机制;另一方面,根据侧翼序列提供的基因信息,我们可以广泛地开展反向遗传学的研究。本研究中,以本室T-DNA插入突变体库为材料,采用PCR扩增对突变体库阳性情况进行了检测。利用TAIL-PCR技术成功分离T-DNA侧翼序列7,333。本研究共收集来自全世界水稻T-DNA侧翼序列144,427条,Tos17侧翼序列22,432条,比较了它们在水稻基因组中的分布规律。通过对T-DNA插入位点序列的分析,揭示了插入位点侧翼序列DNA的物理特性和碱基组成特征。采用正向和反向遗传学的方法,利用已有的突变体库资源,鉴定了2个白化苗突变体,并具体分析由T-DNA插入而产生白化苗性状的基因OsRNase Z的功能。主要研究结果如下:1.以T-DNA上GAL4/VP16基因区段为标记,对15,535个转基因植株DNA进行PCR扩增阳性检测,扩增结果表明13,080个为PCR阳性,阳性率约88.9%。2.利用TAIL-PCR的方法单独分离侧翼序列73,33条,其中T-DNA或载体骨架序列3,343条,水稻基因组序列3,215条,能够在水稻基因组上精确定位序列(E-value<10-5)2361条。同时我们还收集全世界其他研究机构分离的T-DNA和Tos17侧翼序列,用于分析的T-DNA侧翼序列共144,427条,Tos17侧翼序列22,432条。3.对所有收集的侧翼序列分析显示:无论T-DNA和Tos17在染色体上的分布数量还是分布密度都偏向插入到水稻中较大的染色体上,且插入密度和染色体大小高度相关。在同一染色体上,T-DNA倾向于插入到远离着丝粒区域,且分布数量与着丝粒的距离明显正相关;Tos17在染色体两端分布较多,在着丝粒附近和染色体中部分布较少。T-DNA在染色体上的分布和cDNA的分布显著相关,Tos17中不存在这一现象。4.T-DNA和Tos17在水稻基因区间的分布显示,无论T-DNA或Tos17都极度偏向插入基因区,而极度的不偏向插入转座子相关基因中;T-DNA在基因间隔区的插入比较均一,基本不存在偏爱,而Tos17极度不偏向插入基因间隔区。在基因区域中,T-DNA和Tos17偏爱插入基因编码区而偏爱不插入基因调控区;在编码序列中,T-DNA和Tos17偏爱插入外显子区域,而不偏爱插入内含子区域。相对基因间隔区而言,T-DNA和Tos17更偏爱插入到基因编码区。5.我们还对T-DNA和Tos17插入的功能基因进行了分析。在转座子相关基因中,Tos17在在转座子相关基因的插入要相对集中,可能存在偏爱;而T-DNA的插入比较均一,不存在插入热点基因。在转座子和反转座子相关基因中,Tos17更偏爱插入反转座子相关基因,T-DNA对两者没有偏爱。对T-DNA和Tos17插入的具体基因分析,它们可能存在相同的插入热点基因。在不同功能基因中,T-DNA和Tos17共同偏向于插入“Motor”,“Signal transducer”,“Transporter”和“Transcription regulator”等4类功能基因,而不偏向插入“Binding”和“Nutrientreservoir”等2类基因,除此之外,T-DNA还偏向插入“Structural molecule”和“Translation regulator”两类功能基因,不偏向插入“Catalytic”类基因中,而Tos17在这3类功能基因中呈随机分布状态。6.对T-DNA插入位点前后各1 kb的序列(ISNS)弯曲度平均值分析结果显示:在插入位点-200 bp和200 bp的序列区间弯曲度值出现了一个明显的波形变化,在—200和200位置为波谷。最大值波峰分别出现在约-10和10的位置,且在0,即T-DNA插入位点出现陡然的下降出现一个相对低值。其他研究单位提取的ISNS中我们同样观察到了同样的现象,而随机提取的序列的弯曲度值表现为杂乱的曲线。7.对ISNS和随机提取序列的GC skew和TA skew分析发现:两组ISNS的GC与TA skews之间呈显著的负相关。GC与TA skew曲线在插入位点位置出现交叉,且值在插入位点都约为0,表明在插入位点G与C,T与A的含量均等;在-800到0的这段序列里,GC skew值表现为正值,且在-200到-100位置达到最大值,表现为G与C在单链上的极度不均衡分布,与之对应的是TA skew值为负值,但也是在同样位置达到最小值,表现为T与A在单链上的极度不均衡分布;在0-800区域内我们也发现了对应的结果,GC skew值表现为负值,TA skew值表现为正值,且在200到100位置碱基的分布出现极度的不均衡情况。在对照序列的结果中并没有发现这些特征。8.通过对1994个T-DNA插入突变体家系的T1代苗期筛选鉴定,获得2个T-DNA侧翼序列和白化苗性状共分离白化苗突变家系03211EV57和03211DH29。9.在03211EV57家系中,T-DNA插入位点在水稻第5染色体上编码含蛋白激酶结构域的表达蛋白基因的第1个内含子里,在TIGR中的编号为LOCOs05g47770,预测基因全长6,339 bp,CDS总长2,853 bp,由6个外显子和5个内含子组成,编码一个包含951个氨基酸的蛋白,无全长cDNA信息支持。10.在03211DH29家系中,T-DNA插入位点在水稻第9染色体上编码RNase Z基因的第Ⅶ外显子的3′端。在TIGR中的编号为LOCOs09g30466,基因全长3,066bp。KOME提供了该基因的全长cDNA信息(AK070747):cDNA的总长度为1,352bp,由8个外显子和7个内含子组成,编码一个包含365个氨基酸的蛋白,编码蛋白的氨基酸序列与拟南芥RNase Z有97%的相似性,因此将该蛋白命名为OsRNase Z。11.对03211DH29白化苗突变体叶片透射电镜观察发现,叶绿体数目明显减少,并且叶绿体变形,内囊体膜消失,白化苗突变表型的叶绿体中出现前片层体,但不能形成内囊体。叶绿素含量测定表明,在白化苗中叶绿素的合成系统完全丧失。12.全生育期表达谱芯片和RT-PCR结果显示OsRNase Z基因与叶绿素的合成密切相关。OsRNase Z基因的表达和组织的叶绿素含量存在十分明显的正相关,叶绿素含量高的组织基因表达水平就高,叶绿素含量低的组织基因的表达水平就低或者RT-PCR方法未检测到基因表达。13.对中花11中的OsRNase Z基因利用双链RNA进行抑制表达,30%的转化苗出现白化表型,RT-PCR结果显示,在白化苗中OsRNase Z基因的表达基本被抑制。14.PUbi:⊿OsRNase Z-GFP融合表达载体转化拟南芥原生质体,瞬时表达结果表明OsRNase Z基因编码的蛋白定位在叶绿体中。