论文部分内容阅读
真核基因表达是一个复杂、精细且处于动态变化的生物学过程,受基因组调控元件、转录因子、表观遗传修饰和非编码RNA等多因素、多层次的调控。顺式调控元件通过招募不同的反式作用因子使染色质高级结构发生变化,从而启动或沉默基因表达,是基因调控的重要研究内容。因此,基因组中顺式调控元件的鉴定对于深入理解基因表达的分子调控机制具有重要的意义。此外,基因组顺式调控元件的鉴定也蕴含着潜在的应用价值,尤其是在基因治疗等转化医学研究中,具有增强子阻断与异染色质屏障功能的绝缘子元件已经用于提高基因治疗的安全性研究。基因治疗通常具有两种策略:基因补偿(Gene Addition)和基因修复(Gene Repair)。传统的基因治疗采用基因补偿的方法将正常的基因转入细胞内使其表达出功能蛋白,该方法对于重症综合性免疫缺陷病(Severe Combined Immunodeficiency, SCID)、β-地中海贫血(β-thalassemia)等由基因功能缺陷导致的遗传性疾病的治愈或改善都有很好的疗效。然而,用于基因治疗的病毒载体整合入基因组后会诱发周边邻近基因的异常表达,甚至会诱发恶性肿瘤的发生,这种基因毒性(Genotoxicity)的产生成为基因治疗的安全隐患。研究表明,在基因治疗载体两端引入绝缘子元件可降低或消除基因毒性,但迄今为止还未鉴定出人类基因组中高效的绝缘子元件(Insulators)。多功能因子CTCF不仅能促进染色质高级结构的形成,也参与基因的转录激活或抑制。并且,作为脊椎动物体内唯一已知的绝缘子结合蛋白,其对绝缘子元件生物学功能的发挥具有重要的调节作用。例如:经典绝缘子cHS4 (Chicken, DNase I Hypersensitive Site 4)增强子阻断功能的发挥就依赖于CTCF的结合。因此,系统分析人类基因组中CTCF识别位点将有助于人类基因组中绝缘子元件的鉴定。本课题介绍了一种新的整合多组学数据鉴定功能绝缘子的方法:系统挖掘全基因组范围的CTCF识别序列,将基因组中具有相同CTCF核心识别序列的基因组位点归为一个核心序列分组,并结合K562细胞CTCF ChIP-seq 及 DNase I-seq等高通量组学数据,计算每个分组中与CTCF结合的序列所占的比例,即每个分组所具有的CTCF结合率(CTCF Occupancy)。在CTCF高结合率和低结合率的分组中分别随机选取候选序列进行绝缘子功能鉴定。增强子阻断功能实验表明,选自CTCF高结合率分组(≥98.6%)的27个DNA片段均表现出增强子阻断的活性,其中有20个候选绝缘子元件的活性优于cHS4。而选自CTCF低结合率(9.6%-9.8%)组的7个DNA序列仅有1个表现出中等强度的增强子阻断活性(弱于cHS4)。以上结果表明具有CTCF高结合率的DNA序列很大比率拥有增强子阻断的活性。为验证这一结果,我们对A组(CTCF结合率为100%)的另外23个候选序列进行检测,发现该23个DNA片段均具有增强子阻断活性,其中有16个表现出比cHS4更强的增强子阻断活性。综上,我们共鉴定出36个(72%)增强子阻断活性优于cHS4的候选绝缘子元件。这些候选绝缘子元件长度在119 bp-284 bp之间,远小于cHS4(1.2 kb),能被高效地克隆至病毒载体且不会降低病毒滴度。通过上述工作,我们成功建立了人类基因组中绝缘子元件的候选库,为大规模筛选绝缘子元件提供了重要的数据参考与实验依据,已经鉴定出的绝缘子元件有望应用于提高基因治疗体系的安全性。在鉴定绝缘子的过程中,我们还发现有些CTCF结合位点具有沉默子元件(Silencer Elements)的功能。沉默子元件在基因表达过程中也发挥着重要的调控作用,且沉默子的作用方式具有多样性。当前在哺乳动物细胞中,仅有少数工作详细地描述了沉默子元件的功能,其中极少数沉默子具有自发抑制基因表达的功能。本课题鉴定了1个新的人类基因组中自发抑制基因表达的沉默子元件T39,并将它与已报道的3个沉默子(PRE2-S5、MECP2 F3、PDGFA 5’SHS)作了沉默功能的比较。以相似长度的中性序列为对照,我们采用稳定转染细胞系的方法检测了4个沉默子(T39、PRE2-S5、MECP2 F3、PDGFA 5’SHS)的增强子阻断活性和沉默子活性。在红系K562细胞中,T39表现出很强的沉默子活性,PRE2表现出较弱的沉默子活性,另外2个元件(MECP2 F3、PDGFA 5’SH S)则未被检测到具有沉默子活性。另外,通过详细的功能分析发现,T39沉默功能的发挥不受细胞系、启动子类型及其与基因启动子相对位置的影响。随后,我们比较分析了K562细胞中T39与其它3个沉默子元件的染色体特征,发现仅T39的基因组区域位于DNA酶Ⅰ超敏感位点(DNase I Hypersensitive Sites, DHSs)并且包含3个CTCF核心结合序列,参与CTCF介导的染色质互作。综上,我们构建了检测沉默子元件的稳定细胞转染系统,并鉴定了自发性沉默子元件T39,其可以作为其它染色体顺式调控元件(如绝缘子)筛选的对照;同时描述了潜在沉默子元件具备的基本染色质特征并预测了其可能的作用机制。