论文部分内容阅读
目的:在人和哺乳动物基因组中存在大量非编码DNA序列(non-coding DNA,ncDNA),其功能绝大部分还不清楚。研究非编码序列对基因表达调节的机制,进而探寻非编码序列新的生物学功能,对于认识人和哺乳动物的生物学行为,包括分化和衰老,有重要价值。由ncDNA转录得到的非蛋白编码RNA(non-protein coding RNA,ncRNA)数量巨大,有研究显示RNA具有活化基因的作用;本研究室以前的研究也发现外源RNA可促进小鼠白蛋白基因表达并增加该基因对DNaseⅠ消化的敏感性,另外生物信息学分析同样也证实了RNA可以活化基因。虽然已发现某些ncRNA序列具有活化基因和其它生物学效应,但大多数ncRNA序列的功能是未知的。在本项研究中,用能够产生RNA的诱导质粒(来自pcDNA3.1载体)和携带GFP基因的报告质粒(来自pEGFP-C1载体)转染HeLa细胞,研究RNA可能作为一种反式调节因子对GFP报告基因表达的影响。观察RNA的长度、序列和产生位置是否对GFP报告基因表达有不同的影响。在三个层次检测RNA产生位置对GFP报告基因表达的影响,这三个层次分别是在GFP基因下游插入序列,插入序列与GFP基因受同一启动子驱动(相当于与GFP属于同一基因);在质粒的插入序列下游再插入CMV启动子,再于CMV启动子的下游插入不同序列(插入序列与GFP基因受不同的启动子驱动,相当于顺式邻近基因的影响);第三个层次观察共转染的诱导质粒上的插入序列产生的RNA对报告质粒的GFP基因表达的影响(相当于位于不同染色体的基因产生的RNA的影响)。用生物信息学方法比较正在分化的淋巴细胞与静止的淋巴细胞,观察这些细胞中高表达基因内含子大小是否有差异,从而提示内含子RNA是否影响基因表达。增强子是活化基因的顺式元件,在基因表达调节中起重要作用。增强子突变会导致其功能发生改变。本研究室的前期工作发现:将14个Alu同向串联(Alu×14)后插入到pEGFP-C1质粒的GFP基因下游,构建C1-Alu×14质粒,瞬时转染HeLa细胞,Alu×14序列显著抑制GFP基因表达;再将SV40PolyA正、反序列插入到C1-Alu×14质粒的GFP和Alu×14之间,结果显示SV40PolyA序列能解除Alu×14对GFP基因的抑制作用。通过删减SV40PolyA得到一段长22bp的片段(简称22R,5'-GTGAAAAAAATGCTTTATTTGT,结构见第二部分Fig.1),发现22R能活化基因,对22R进行点突变后获得4TMI (5'-GTGAAATAAATGCTTTTTTTGT),发现4TMI有更强的活化基因作用。22R和4TMI均有对称结构,可能形成不稳定茎环(unstable stem-loopstructure),而22R的另一突变体4T (5'-GTGAAAAAAATGCTTTTTTTGT)不活化基因,其序列可形成稳定的茎环,因此推测增强子活化基因能力与序列形成不稳定茎环或一定的结构有关。为了进一步探讨22R活化基因的机理,本研究对22R序列3核苷酸环(loop)的碱基进行了突变,包括野生型共128个(其中正序插入64个,反序64个),选择C1-Alu×14作为表达载体构建的基础,在Alu重复序列上游插入短序列增强子构建表达载体;然后转染HeLa细胞,通过荧光显微镜、流式细胞术、Northern杂交检测GFP表达情况,观察分析这128种序列对GFP报告基因表达的影响。所得实验结果结合生物信息学分析,探讨3碱基loop中碱基类型对基因表达影响的规律,对阐明DNA结构在基因表达调节中的作用有重要意义。不稳定茎-环结构调节基因表达可能是非编码序列的新功能。方法:1引物及模板DNA片段的合成。委托DNA合成公司合成带适当酶切位点的引物和带有不同突变位点的DNA模板。论文附表中列出了所使用的引物及模板序列及其名称。2重组报告质粒和诱导质粒的构建PCR扩增目的片段,目的片段包括质粒中的DNA序列和合成的DNA片段,酶切后插入pEGFP-C1质粒,获得插有一个片段报告质粒,利用XbaⅠ/NheⅠ酶切位点可以用T4DNA连接酶连接,但是连接以后的序列不能被其中的任何一个酶切断的特性制备同向二串联体,或多个拷贝的插入序列串联体的质粒。HindIII/Kpn I酶切pcDNA3.1,琼脂糖电泳胶分离大片段,带有串联体的报告质粒用Hind III/Kpn I酶切,胶分离插入串联体中的小片段,连接大小片段,获得正向插入串联体的诱导质粒;Kpn I/Xba I酶切pcDNA3.1,琼脂糖电泳胶分离大片段,带有串联体的报告质粒用Kpn I/Xba I酶切,胶分离插入串联体中的小片段,连接大小片段,获得反向插入串联体的诱导质粒。3细胞转染用LipofectamineTM2000瞬时转染HeLa细胞,包括报告质粒转染和报告质粒与诱导质粒共转染两种转染方法,详见论文正文。4荧光显微镜观察将重组质粒转染Hela细胞后荧光显微镜下计数GFP荧光阳性细胞数。5Northern杂交用9N随机引物和大肠杆菌DNA聚合酶大片段,将α-32P-dCTP掺入DNA中制备GFP探针。提取转染细胞总RNA,甲醛变性琼脂糖凝胶电泳,将RNA转移到尼龙膜。32P标记的GFP探针杂交、冲洗后通过放射自显影记录实验结果。然后,这种杂交过的尼龙膜用剥离液处理,去除32P-GFP探针,用检测neo RNA的探针再次杂交,放射自显影作为转染效率的对照。6流式细胞分析委托河北医科大学第四医院完成。7PAGE电泳区别DNA寡核苷酸构象合成的不同DNA单链小片段(22nt,带有单碱基突变)用20%的变性胶在室温进行PAGE,银染,观察不同DNA小片段泳动速度,然后用非变性胶电泳(改变温度和离子强度),观察DNA小片段电泳速度,推测它们是否形成了不同的空间构象。8生物信息学分析从UniGene库获得基因表达数据。从UniGene库获得基因表达数据(http://www.ncbi.nlm.nih.gov/UniGene/lbrowse2.cgi?TAXID=9606&CUTOFF=1000)。选择高表达的基因,从人类基因组资源库(http://www.ncbi.nlm.nih.gov/genome/guide/human/)获得内含子和外显子数据,使用微软Excel软件对内含子的长度和数量进行统计学分析。结果:1重组诱导质粒及报告质粒构建和鉴定所有构建成功用于实验的质粒,均通过酶切和测序鉴定正确。2RNA以长度和序列依赖的方式影响基因表达诱导质粒与报告质粒共转染,发现诱导质粒以长度和序列依赖方式影响基因表达,例如诱导质粒pcAlu×14能引起报告质粒C1-Alu×8中的GFP的表达,但是诱导质粒pc280-1×14不能引起报告质粒C1-Alu×8中的GFP的表达,说明诱导质粒的插入序列不同对报告质粒的GFP基因影响不同。RNA活化GFP报告基因也具有长度依赖性,例如pcAlu×14诱导质粒引起的报告质粒的GFP基因的阳性细胞率显著高于pcAlu×1(p<0.05)。以上结果说明:诱导质粒产生RNA以序列和长度依赖的方式影响基因的表达。3RNA以位置依赖的方式活化基因为了进一步研究RNA产生的位置(与GFP同一基因及顺式临近基因)对GFP报告基因表达的影响,把目的基因分别插入到GFP基因下游及邻近部位,研究基因的重复序列是否可以激活GFP基因的表达。质粒C1-Alu×1-Alu×14比质粒C1-280-1×1-280-1×14有更强的基因抑制作用;在具有增强子4TMI时,Alu序列(C1-Alu×1-4TMI×2-Alu×14)诱导GFP基因表达比280-1(C1-280-1×1-4TMI×2-280-1×14)更强;分析下游序列对GFP基因表达的的影响与产生的RNAs(从基因本身产生的RNA影响其自身表达)有关。在C1-280-1×14载体中280-1×14的下游插入CMV,然后在CMV启动子的下游插入不同的序列,构建质粒(相当于改变GFP基因相邻基因的序列)。结果表明,质粒C1-280-1×14-CMV-280-1×2中CMV下游插入的2个280-1正和Alu-280-1正比其他序列有活化GFP报告基因作用。插入含有两个相同序列的诱导质粒对C1-280-1×14中的GFP基因表达没有显著影响(数据见论文第一部分)。同一基因和临近基因序列对GFP报告基因产生明显影响,但是诱导质粒中的同样序列产生影响较弱。这些结果说明, RNA产生的位置是影响报告基因表达的因素。当这些重复序列分别插入pcDNA3.1载体中构造诱导质粒与相应报告质粒进行共转染时,他们没有激活报告基因,这些结果表明,RNA序列和RNA产生位置是影响基因表达的重要因素。4在分化细胞中大基因高表达通过生物信息学分析比较胸腺细胞和T细胞,生发中心B细胞和B细胞中高表达基因中大基因(≥60000bp)的数量,比较高表达基因中内含子的大小,发现在未分化细胞中大基因数量多,平均每个内含子的碱基多。522R序列loop3碱基突变体(正序)对GFP报告基因表达的影响22R序列(5'-GTGAAAAAAATGCTTTATTTGT)及其loop3碱基的突变体(正序)分别插入到C1-Alu×14载体的Alu序列上游,构建表达载体,转染HeLa细胞。流式细胞仪检测结果和荧光显微镜分析及Northern Blot均表明,loop环3碱基突变可明显影响增强子的活性。例如:GTG质粒(5'-GTGAAAAAAAGTGTTTATTTGT)荧光阳性率为3.77%,AAA质粒(5'-GTGAAAAAAAAAATTTATTTGT)荧光阳性率为0.24%。622R序列loop3碱基突变体反序列对GFP报告基因表达的影响将两拷贝的22R序列loop3碱基突变体反序构建表达载体,转染HeLa细胞,用流式细胞仪检测GFP阳性细胞,22R突变体反序大部分的荧光阳性百分数和平均荧光强度高于其正序,如:CTG正序百分数为43.23,平均荧光强度为6.5,反序百分数为65.06,平均荧光强度为25.2荧光强度平均数的比值(反序/正序)为3.88;AGG正序百分数为52.85,平均荧光强度为11.9,反序百分数为60.75,平均荧光强度为25.4,荧光强度平均数的比值(反序/正序)为2.84;仅有一个例外,AGC正序百分数为67.17,平均荧光强度为18.8,反序百分数为60.75,平均荧光强度为25.4,荧光强度平均数的比值(反序/正序)为1.35,说明突变体的反序活化基因作用强于其正序。7PAGE电泳区别DNA寡核苷酸构象用20%的变性胶在室温进行PAGE,发现所有的寡核苷酸的电泳迁移率基本相同。而在低温和增大离子强度时富含T碱基的序列迁移率受影响较小,所以用富含T的序列作为分子量对照,在室温,1×TBE缓冲液中电泳,TAA、TAT、TAC、TAG和CTA序列的泳动速度最快,而其他序列的迁移率相当。在更低温度(4℃)下1×TBE缓冲液中进行电泳,虽然不同序列的迁移率有更大的差别,但是TAA、TAT、TAC、TAG和CTA序列的泳动速度还是最快的。这些结果说明loop位碱基影响序列的次级结构,可能涉及到增强子活性。结论:1RNA以长度和序列依赖的方式特异性影响基因表达,诱导质粒的插入序列和长度不同对报告质粒的GFP基因影响不同。2RNA产生位置显著影响基因表达,同一基因和临近基因序列对GFP报告基因产生明显影响,但是诱导质粒中的同样序列产生影响较弱。322R Loop的碱基类型影响序列的次级结构,显著影响增强子活性。422R突变体正反序对GFP基因表达的影响不同,反序大部分的荧光阳性百分数和平均荧光强度高于其正序。5PAGE电泳显示,22R及其突变体单链在低温和非变性胶条件下可以形成次级结构。6生物信息学表明正在分化和分裂的细胞大基因高表达,提示产生更多的内含子RNA。