论文部分内容阅读
摘 要:转座子(TEs)是可以在基因组内移动的DNA序列。TEs可以通过多种机制大幅度地塑造基因组,转录本和宿主生物的蛋白组。但是,TEs通常干扰基因并且是宿主基因组不稳定,这样本质上降低了宿主生物的适合度。理解TEs的基因组的干扰和进化的动态将大大地加深我们对TE介导的生物过程的理解。大部分TE插入在黑腹果蝇中是高度多态的,提供给我们一个很好的系统在群体水平来研究TEs的进化。数十年的理论和实践的研究已经很好的建立起“转座-选择”群体基因模型,此模型假设在TE复制和单纯选择之间的平衡决定TEs在基因组内克隆的数目。在过去的十年中,P元件诱导的wimpy testis-interacting RNAs(piRNAs)被证明是TE在果蝇中活动的主要抑制着。piRNAs的发现革新了我们对TE抑制的理解,因为它揭示了宿主生物已经进化出一种适应性的机制来抵御TE的入侵。大量的项目被实施来理解piRNAs抑制活跃的TEs的分子机制,尽管在此过程中的许多细节仍待进一步的探索。piRNAs和TEs之间的相互作用很好的解释了在果蝇中I-R系统和P-M系统杂种不育的根本分子机制,这曾困扰进化生物学家数十年。piRNA抑制通路给我们提供了一个无与伦比的系统来研究寄生物和宿主之间共进化的过程。
关键词:piRNA;转座子;转座子沉默;“Ping-Pong”循环
1.介绍
杂种不相容常常导致两亚种之间的生殖隔离,这对选育很重要。杂种不相容的经典基因机制是Bateson-Dobzhansky-Muller模型。在此模型下,当一个祖先种群分化成两个亚群是,原始的两个相互作用的基因,在祖先种群中是aa和bb,在两个亚种中分别进化成AA和bb,aa和BB。如果配子A和B相互不相容,则两个亚种的杂交后代将会死亡或者不育,导致两个亚种的生殖隔离。在众多导致杂种不育可能的机制中,一个重要的形式是外来基因组冲突。当在一个基因组内的基因被不同的机制传送输,或者当一个基因通过损害宿主增加其传输时,外来基因冲突兴起。然后宿主马上发展策略来抑制这自私的基因元件造成的决定性影响。基因组的冲突常常经常导致杂种不相容或者杂种不育。
转座子(TEs)代表了一种在几乎所有生物基因组内的自私元件,而P元件诱导的piRNAs代表sRNAs中的一种,sRNAs在动物生殖细胞中抑制TEs。piRNA通路的发现很好地解释了长久以来的进化上的观察,比如导致果蝇杂种不育的I-R系统和P-M系统。在此,我们简短地总结在生物基因,机制和在模式生物果蝇中piRNAs的功能的研究过程,并且我们讨论TEs和piRNAs相互作用可能的进化寓意。
2.TEs
TEs的含量在真核生物基因组中变化广泛,从1%到80%。根据移动的机制,TEs被分为转座子和反转座子。转座子是在基因组中可移动的DNA片段,可以通过“cut and paste”被转座到另一个位点,然而反转座子是通过RNA的反转录以“copy and paste”的方式来介导和复制,以致插入新的位点。TEs可以通过水平转移在物种间穿行。
经过长时间的进化,TEs通过大量的机制形成了宿主基因组的组分。首先,同源TEs的拷贝分散在基因组中可以诱导异位重组。第二,TEs可以被馴化形成编码蛋白质的基因的新结构域。第三,TEs的适应扩展可以提供新的基序来调控基因表达。TE插入已经被很好的证明是有助于宿主的适应性进化,通过影响周围基因的表达。尽管TEs很大程度上影响基因组的进化,但是它们基本对宿主有损害,因为:1.破坏编码和基因的调控区域;2.减少细胞的能量和资源;3.通过异位重组介导细胞错误的重排。
TEs在果蝇中已被研究数十年。大约120TE家族已经在D.melanogaster内被识别,这至少占真核生物基因组的5%。在D.melanogaster内有约2000未激活的inaction vation escape 1(INE-1)基因家族的拷贝,即使对于大部分TE家族拷贝的数目在1到300之间。基于这种表达的模式,TEs可以被分为生殖细胞特异,体细胞和介导群体。大部分在果蝇中的TEs是活跃的,并且在D.melanogaster内产生可见表型的突变几乎50%到80%都是由TEs导致。估计TEs降低了大约0.4%到5%的果蝇适合度。
3.Argonaute蛋白
自从RNA干扰(RNAi)机制被发现,sRNAs的全部内容正在被探究。Argonaute(AGO)蛋白结合sRNAs并且形成RNA诱导的复合物(RISC),在RISC中sRNAs识别带有互补序列的目标基因,AGO蛋白剪切和抑制目标基因。AGO由四个结构域组成:N末端结构域,PAZ结构域结合RNAs,MID结构域结合mRNA的Cap结构,PIWI结构域对目标基因的剪切至关重要。AGO蛋白很古老并且可以在几乎所有真核生物中找到,除了Saccharomyces cerevisiae。AGO家族的大小在不同物种中不同,在哺乳动物中有八个基因,果蝇中五个,线虫中27个。AGO蛋白质被分成三个分支:AGO,PIWI和线虫特异的AGO(WAGO)分支。微RNAs(miRNAs)和小干扰RNAs(siRNAs)都可以与AGO蛋白结合并且参与在细胞质中的转录后基因沉默过程,而PIWI蛋白主要在生殖腺表达,结合piRNAs类沉默TEs。WAGO蛋白在线虫内参与独特的RNAi系统。
果蝇的基因组含有五种AGO基因,包括两个成员来自AGO分支(ago1和ago2)和三个成员来自PIWI分支(piwi,aub和ago3)。定位三种PIWI蛋白质是很困难的。Aub和Ago3位于生殖细胞的细胞核周围的电子聚集云团中,而Piwi的主要位点是卵的生殖细胞和体细胞的细胞核。在卵发育过程中Piwi也位于细胞质中。这三种PIWI蛋白有强烈的与piRNAs结合的偏好。piRNAs反义的TE转录本主要被Piwi和Aub结合,而piRNAs正义的TEs主要被Ago3结合。因为Drosha和Dicer不参与piRNA通路,piRNAs的生物通路不同于miRNAs和内源的siRNAs。piRNA生物起源是很复杂的并且具体的机制需进一步的探究,但是已知Piwi,Aub和Ago3参与piRNA的生成,通过“Ping-Pong”模型来沉默目标。 4.在果蝇中的piRNAs:a snapshot
在果蝇中,piRNAs是23-29nt的sRNAs,主要表达在生殖细胞中。第一个鉴定的piRNAs是重复相关的siRNASA(rasiRNAs),来自于the Y-linked Suppressor of Stellate位于D.melanogaster。这些piRNAs被发现是沉默the X-linked串联重复的stellate基因。此后,piRNAs被发现作为主要的调节者来抑制果蝇中的TEs和其他模式生物,比如小鼠,大鼠,线虫和斑马鱼。piRNA的全部序列很复杂,上千个分离的piRNA序列存在于果蝇的基因组上。还有,不同的piRNAs的序列之间没有结构或者功能的相似,除了第一个核苷酸上的尿嘧啶这个很强的偏差外。在果蝇中,piRNAs通过完美或几近完美的反义匹配来识别它们的靶标,主要是活跃的TEs的mRNAs。piRNAs通过“Ping-Pong”循环来抑制它们的目标mRNAs。
5.piRNA簇
piRNAs基因组水平的图谱表明D.melanogaster中大部分piRNAs是来源于离散的位点,也被称为piRNAs簇。只有小部分piRNAs来自于基因的区域,比如来自tj的3’UTR。至少142个piRNAs簇被证实位于D.melanogaster的基因组上并且这些簇聚集在重复序列或者未激活的TE片段。piRNAs簇最高达200kb,并且它们偏好位于异染色体区域,此区域的特质是在组蛋白H3的赖氨酸9的三甲基化(H3K9me3),并且组蛋白H3结合异染色体蛋白1(HP1)。这些异染色体区域通常不易重组,所以降低了单纯选择的有效性,此区域被认为是TEs积累和发展成piRNA簇的“safe harbors”。所以,几乎所有研究表明异染色体的形成对于piRNAs的正常生成至关重要。
基于成熟piRNAs的线性分布,piRNAS簇被分为“uni-strand”和“dual-strand”簇。“uni-strand”簇含有位于一个基因组线的piRNAs,比如flamenco簇位于X染色体并且长达180kb,这是对应于腺囊满中的体细胞piRNAs(体细胞在生殖细胞周围)。“uni-strand”piRNA簇可能被经典RNA转录酶2(RNAP2)转录。比如,flamenco簇被Ci蛋白质激活并且flamenco的转录本前体经历选择性剪切后生成各种各样的piRNA前体。可见一个P因子插入Flamenco的5’末端会导致在此簇中的所有转录失败。
“dual-strand”簇产生决大部分D.melanogaster基因组中的piRNAs,产生的piRNAs位于两条链。“dual-strand”簇通常不展示RNAP2转录的标记,因为它们缺少明确的启动子,5’甲基-尿嘧啶cap和明确的转录终止信号,可能是异染色体蛋白Rhino,Deadlock和转录终止辅因子Cutoff形成“RDC”復合物来介导双链piRNA簇在果蝇卵中的转录。此外,Rhino,Cutoff和RNA解旋酶UAP56被要求来抑制前体转录本的剪接,为了piRNAs。并且,一个piRNAs簇的双链的转录被要求为了形成piRNAs的正确产物。
6.初级piRNA的成熟
在卵泡细胞中,只有PiWi表达,没有Aub或者Ago3。单链piRNA簇的转录本首先被转录到细胞质中的Yb小体内。位于线粒体外膜上的Zucchini(Zuc)剪切长单链转录本,并且生成piRNA中间物。piRNA中间物的5’末端被负载于生殖细胞Yb小体的Piwi上。明显的piRNAs5’端尿嘧啶偏差与Piwi的MID结构域相互联系。此外,piRNA的3’末端被Nibler或者Trimmer和其PIWIs的辅因子修剪形成成熟的长度。当3’末端的修剪停在被Piwi保护的piRNA中间物的区域,3’末端被Hen1甲基化,形成成熟初级piRNAs的一个2’-O-甲基化修饰。在生殖细胞中,成熟的初级piRNAs能够以转录后的方式来识别和摧毁目标转录本。许多其他的蛋白质也参与了卵泡细胞中初级piRNAs的成熟。这些蛋白质包括Tudor protein Yb,Vreteno(Vret),Minotaur(Mino),Gasz,解旋酶Armitage(Armi),伴侣因子Shutdown(Shu),还有热休克蛋白90(Hsp90),其中大部分都锚定在线粒体外膜上。
在生殖细胞中,Vasa和UAP56识别piRNA簇的转录本,并且将它们从细胞核转移到细胞质中。在生殖细胞中,初级piRNA的处理与卵泡细胞中的机制类似,除了Piwi,Aub和Ago3都被表达, 但是只有Piwi和Aub负载成熟的初级piRNA。Aub负载的初级piRNA,与Ago3一起,通过一个“Ping-Pong”循环来产生次级piRNA。
7.“Ping-Pong”循环扩增次级piRNA并且沉默靶标基因
“Ping-Pong”循环是一个在生殖细胞TE抑制中很好的机制。简单来说,在“Ping-Pong”循环中,一个Ago3相关的piRNA识别一条互补的转录本(通常来自于活跃的TE),并且Ago3根据Ago3结合piRNA的10个碱基来剪切靶标基因的位点,然后产生新的被Aub负载的piRNA。这个Aub负载的piRNA反过来又识别和剪切一条互补的TE转录本,产生一个与初始Ago3负载piRNA一样的新piRNA。piRNA在“Ping-Pong”循环过程中被扩增,产生在正义链和反义链之间10个碱基对的重叠序列。“Ping-Pong”循环同时也消耗了TE的转录本,因此沉默了TE。
8.总结和展望
过去的十年,piRNA的发现革新了我们对TE沉默的分子机制的理解。piRNA和TE之间的相互作用很好地解释了在果蝇I-R和P-M系统的杂交不育。在初级和次级piRNA生产过程中,有多种蛋白质的参与,最重要的是PiWi、Aub和Ago3,并伴随着“Ping-Pong”循环来扩增次级piRNA。更多新的piRNA的生成是沉默相对应TE的基础。一些研究表明,piRNA与其蛋白复合物与TE特异性结合后,招募重塑蛋白、DNA甲基化蛋白、组蛋白甲基转移酶来使TE沉默。
但是,一些基本的问题亟待去进一步的探究。从进化的角度,为什么果蝇选择了使用piRNA机制来抵抗TE?在piRNA生成和作用的过程中,哪些蛋白质结合了piRNA,对piRNA起什么作用?piRNA如何识别TE,又如何沉默TE?回答这些问题将毫无疑问地帮助我们更好的理解有关piRNA的基本问题,也将有助于从研发有关piRNA的应用,比如对RNA的编辑、对基因的沉默调控等。
关键词:piRNA;转座子;转座子沉默;“Ping-Pong”循环
1.介绍
杂种不相容常常导致两亚种之间的生殖隔离,这对选育很重要。杂种不相容的经典基因机制是Bateson-Dobzhansky-Muller模型。在此模型下,当一个祖先种群分化成两个亚群是,原始的两个相互作用的基因,在祖先种群中是aa和bb,在两个亚种中分别进化成AA和bb,aa和BB。如果配子A和B相互不相容,则两个亚种的杂交后代将会死亡或者不育,导致两个亚种的生殖隔离。在众多导致杂种不育可能的机制中,一个重要的形式是外来基因组冲突。当在一个基因组内的基因被不同的机制传送输,或者当一个基因通过损害宿主增加其传输时,外来基因冲突兴起。然后宿主马上发展策略来抑制这自私的基因元件造成的决定性影响。基因组的冲突常常经常导致杂种不相容或者杂种不育。
转座子(TEs)代表了一种在几乎所有生物基因组内的自私元件,而P元件诱导的piRNAs代表sRNAs中的一种,sRNAs在动物生殖细胞中抑制TEs。piRNA通路的发现很好地解释了长久以来的进化上的观察,比如导致果蝇杂种不育的I-R系统和P-M系统。在此,我们简短地总结在生物基因,机制和在模式生物果蝇中piRNAs的功能的研究过程,并且我们讨论TEs和piRNAs相互作用可能的进化寓意。
2.TEs
TEs的含量在真核生物基因组中变化广泛,从1%到80%。根据移动的机制,TEs被分为转座子和反转座子。转座子是在基因组中可移动的DNA片段,可以通过“cut and paste”被转座到另一个位点,然而反转座子是通过RNA的反转录以“copy and paste”的方式来介导和复制,以致插入新的位点。TEs可以通过水平转移在物种间穿行。
经过长时间的进化,TEs通过大量的机制形成了宿主基因组的组分。首先,同源TEs的拷贝分散在基因组中可以诱导异位重组。第二,TEs可以被馴化形成编码蛋白质的基因的新结构域。第三,TEs的适应扩展可以提供新的基序来调控基因表达。TE插入已经被很好的证明是有助于宿主的适应性进化,通过影响周围基因的表达。尽管TEs很大程度上影响基因组的进化,但是它们基本对宿主有损害,因为:1.破坏编码和基因的调控区域;2.减少细胞的能量和资源;3.通过异位重组介导细胞错误的重排。
TEs在果蝇中已被研究数十年。大约120TE家族已经在D.melanogaster内被识别,这至少占真核生物基因组的5%。在D.melanogaster内有约2000未激活的inaction vation escape 1(INE-1)基因家族的拷贝,即使对于大部分TE家族拷贝的数目在1到300之间。基于这种表达的模式,TEs可以被分为生殖细胞特异,体细胞和介导群体。大部分在果蝇中的TEs是活跃的,并且在D.melanogaster内产生可见表型的突变几乎50%到80%都是由TEs导致。估计TEs降低了大约0.4%到5%的果蝇适合度。
3.Argonaute蛋白
自从RNA干扰(RNAi)机制被发现,sRNAs的全部内容正在被探究。Argonaute(AGO)蛋白结合sRNAs并且形成RNA诱导的复合物(RISC),在RISC中sRNAs识别带有互补序列的目标基因,AGO蛋白剪切和抑制目标基因。AGO由四个结构域组成:N末端结构域,PAZ结构域结合RNAs,MID结构域结合mRNA的Cap结构,PIWI结构域对目标基因的剪切至关重要。AGO蛋白很古老并且可以在几乎所有真核生物中找到,除了Saccharomyces cerevisiae。AGO家族的大小在不同物种中不同,在哺乳动物中有八个基因,果蝇中五个,线虫中27个。AGO蛋白质被分成三个分支:AGO,PIWI和线虫特异的AGO(WAGO)分支。微RNAs(miRNAs)和小干扰RNAs(siRNAs)都可以与AGO蛋白结合并且参与在细胞质中的转录后基因沉默过程,而PIWI蛋白主要在生殖腺表达,结合piRNAs类沉默TEs。WAGO蛋白在线虫内参与独特的RNAi系统。
果蝇的基因组含有五种AGO基因,包括两个成员来自AGO分支(ago1和ago2)和三个成员来自PIWI分支(piwi,aub和ago3)。定位三种PIWI蛋白质是很困难的。Aub和Ago3位于生殖细胞的细胞核周围的电子聚集云团中,而Piwi的主要位点是卵的生殖细胞和体细胞的细胞核。在卵发育过程中Piwi也位于细胞质中。这三种PIWI蛋白有强烈的与piRNAs结合的偏好。piRNAs反义的TE转录本主要被Piwi和Aub结合,而piRNAs正义的TEs主要被Ago3结合。因为Drosha和Dicer不参与piRNA通路,piRNAs的生物通路不同于miRNAs和内源的siRNAs。piRNA生物起源是很复杂的并且具体的机制需进一步的探究,但是已知Piwi,Aub和Ago3参与piRNA的生成,通过“Ping-Pong”模型来沉默目标。 4.在果蝇中的piRNAs:a snapshot
在果蝇中,piRNAs是23-29nt的sRNAs,主要表达在生殖细胞中。第一个鉴定的piRNAs是重复相关的siRNASA(rasiRNAs),来自于the Y-linked Suppressor of Stellate位于D.melanogaster。这些piRNAs被发现是沉默the X-linked串联重复的stellate基因。此后,piRNAs被发现作为主要的调节者来抑制果蝇中的TEs和其他模式生物,比如小鼠,大鼠,线虫和斑马鱼。piRNA的全部序列很复杂,上千个分离的piRNA序列存在于果蝇的基因组上。还有,不同的piRNAs的序列之间没有结构或者功能的相似,除了第一个核苷酸上的尿嘧啶这个很强的偏差外。在果蝇中,piRNAs通过完美或几近完美的反义匹配来识别它们的靶标,主要是活跃的TEs的mRNAs。piRNAs通过“Ping-Pong”循环来抑制它们的目标mRNAs。
5.piRNA簇
piRNAs基因组水平的图谱表明D.melanogaster中大部分piRNAs是来源于离散的位点,也被称为piRNAs簇。只有小部分piRNAs来自于基因的区域,比如来自tj的3’UTR。至少142个piRNAs簇被证实位于D.melanogaster的基因组上并且这些簇聚集在重复序列或者未激活的TE片段。piRNAs簇最高达200kb,并且它们偏好位于异染色体区域,此区域的特质是在组蛋白H3的赖氨酸9的三甲基化(H3K9me3),并且组蛋白H3结合异染色体蛋白1(HP1)。这些异染色体区域通常不易重组,所以降低了单纯选择的有效性,此区域被认为是TEs积累和发展成piRNA簇的“safe harbors”。所以,几乎所有研究表明异染色体的形成对于piRNAs的正常生成至关重要。
基于成熟piRNAs的线性分布,piRNAS簇被分为“uni-strand”和“dual-strand”簇。“uni-strand”簇含有位于一个基因组线的piRNAs,比如flamenco簇位于X染色体并且长达180kb,这是对应于腺囊满中的体细胞piRNAs(体细胞在生殖细胞周围)。“uni-strand”piRNA簇可能被经典RNA转录酶2(RNAP2)转录。比如,flamenco簇被Ci蛋白质激活并且flamenco的转录本前体经历选择性剪切后生成各种各样的piRNA前体。可见一个P因子插入Flamenco的5’末端会导致在此簇中的所有转录失败。
“dual-strand”簇产生决大部分D.melanogaster基因组中的piRNAs,产生的piRNAs位于两条链。“dual-strand”簇通常不展示RNAP2转录的标记,因为它们缺少明确的启动子,5’甲基-尿嘧啶cap和明确的转录终止信号,可能是异染色体蛋白Rhino,Deadlock和转录终止辅因子Cutoff形成“RDC”復合物来介导双链piRNA簇在果蝇卵中的转录。此外,Rhino,Cutoff和RNA解旋酶UAP56被要求来抑制前体转录本的剪接,为了piRNAs。并且,一个piRNAs簇的双链的转录被要求为了形成piRNAs的正确产物。
6.初级piRNA的成熟
在卵泡细胞中,只有PiWi表达,没有Aub或者Ago3。单链piRNA簇的转录本首先被转录到细胞质中的Yb小体内。位于线粒体外膜上的Zucchini(Zuc)剪切长单链转录本,并且生成piRNA中间物。piRNA中间物的5’末端被负载于生殖细胞Yb小体的Piwi上。明显的piRNAs5’端尿嘧啶偏差与Piwi的MID结构域相互联系。此外,piRNA的3’末端被Nibler或者Trimmer和其PIWIs的辅因子修剪形成成熟的长度。当3’末端的修剪停在被Piwi保护的piRNA中间物的区域,3’末端被Hen1甲基化,形成成熟初级piRNAs的一个2’-O-甲基化修饰。在生殖细胞中,成熟的初级piRNAs能够以转录后的方式来识别和摧毁目标转录本。许多其他的蛋白质也参与了卵泡细胞中初级piRNAs的成熟。这些蛋白质包括Tudor protein Yb,Vreteno(Vret),Minotaur(Mino),Gasz,解旋酶Armitage(Armi),伴侣因子Shutdown(Shu),还有热休克蛋白90(Hsp90),其中大部分都锚定在线粒体外膜上。
在生殖细胞中,Vasa和UAP56识别piRNA簇的转录本,并且将它们从细胞核转移到细胞质中。在生殖细胞中,初级piRNA的处理与卵泡细胞中的机制类似,除了Piwi,Aub和Ago3都被表达, 但是只有Piwi和Aub负载成熟的初级piRNA。Aub负载的初级piRNA,与Ago3一起,通过一个“Ping-Pong”循环来产生次级piRNA。
7.“Ping-Pong”循环扩增次级piRNA并且沉默靶标基因
“Ping-Pong”循环是一个在生殖细胞TE抑制中很好的机制。简单来说,在“Ping-Pong”循环中,一个Ago3相关的piRNA识别一条互补的转录本(通常来自于活跃的TE),并且Ago3根据Ago3结合piRNA的10个碱基来剪切靶标基因的位点,然后产生新的被Aub负载的piRNA。这个Aub负载的piRNA反过来又识别和剪切一条互补的TE转录本,产生一个与初始Ago3负载piRNA一样的新piRNA。piRNA在“Ping-Pong”循环过程中被扩增,产生在正义链和反义链之间10个碱基对的重叠序列。“Ping-Pong”循环同时也消耗了TE的转录本,因此沉默了TE。
8.总结和展望
过去的十年,piRNA的发现革新了我们对TE沉默的分子机制的理解。piRNA和TE之间的相互作用很好地解释了在果蝇I-R和P-M系统的杂交不育。在初级和次级piRNA生产过程中,有多种蛋白质的参与,最重要的是PiWi、Aub和Ago3,并伴随着“Ping-Pong”循环来扩增次级piRNA。更多新的piRNA的生成是沉默相对应TE的基础。一些研究表明,piRNA与其蛋白复合物与TE特异性结合后,招募重塑蛋白、DNA甲基化蛋白、组蛋白甲基转移酶来使TE沉默。
但是,一些基本的问题亟待去进一步的探究。从进化的角度,为什么果蝇选择了使用piRNA机制来抵抗TE?在piRNA生成和作用的过程中,哪些蛋白质结合了piRNA,对piRNA起什么作用?piRNA如何识别TE,又如何沉默TE?回答这些问题将毫无疑问地帮助我们更好的理解有关piRNA的基本问题,也将有助于从研发有关piRNA的应用,比如对RNA的编辑、对基因的沉默调控等。