论文部分内容阅读
恶性肿瘤的发生、发展是一个涉及多基因、多因素的复杂过程,在这一过程中,肿瘤细胞的染色质开放状态会发生重大改变。研究不同肿瘤的染色质开放性特征不仅可以深入了解肿瘤发生、发展的生物学基础,而且这些特征也有潜力作为一类新型生物标志物在肿瘤分子分型、早期诊断和治疗评估等领域发挥重要作用。在前期工作中,我们首先针对2013年开发出的用于研究染色质开放性特征的ATAC-seq测序技术存在大量丢失染色质开放性信息的问题,建立起一种新的基于ss DNA的NGS文库构建方法——SALP。在此基础上,本研究运用这一新技术以常见恶性肿瘤肺癌和胶质瘤为研究对象,对其染色质开放状态以及开放区域的基因组学表现进行研究,主要研究结果包括:(1)收集胶质瘤患者的肿瘤组织,利用SALP技术构建文库,之后使用Illumina Hiseq X Ten平台测序,通过生物信息学分析,发现大部分染色质开放性区域位于远端基因间区域、其次是内含子区域,在外显子区域等分布最少;通过与正常脑组织细胞样本对比,发现肿瘤组织分离细胞有2925处染色质区域开放状态增高,8处染色质区域开放状态降低(FDR<=0.05);利用Homer对Peak进行基因注释,发现1008个基因的染色质开放状态发生改变;随后利用PANTHER对这些基因进行GO富集分析,发现这些染色质开放状态发生改变的基因富集在神经元组成、突触、质膜蛋白复合物、细胞信号转导等功能上;从染色质开放状态发生显著改变的基因中,我们筛选出TRPM4、CHRFAM7A等16个基因,其中有6个已报道与恶性肿瘤相关,有11个已报道与神经系统疾病有关;利用中国脑胶质瘤基因组图谱数据库中胶质瘤患者相关基因的表达数据和匹配的临床数据,以TRPM4、CHRFAM7A基因为例,使用survival包中的survfit函数用Kaplan-Meier法对其进行生存分析,并分析其基因表达水平与WHO分级、IDH基因突变情况和1p/19q联合缺失状态的相关性,以及比较原发性胶质瘤和复发性胶质瘤肿瘤组织中相关基因的表达水平,进一步了解这些基因与胶质瘤发生、发展及预后的关系;为探究在胶质瘤发生、发展过程中,差异开放染色质区域调控肿瘤发生的模式,我们通过MEME和DREME两款软件预测de novo motif;利用Centri Mo识别在序列中心区域显著富集的motif;采用Tomtom软件将预测到的de novo motif与HOCOMOCO human v10数据库的已知motif进行比较,确定二者的相似度,从而分析在这些区域上富集的转录因子,对所预测出的转录因子在恶性肿瘤及神经系统疾病中的研究现状进行文献复习,发现其中存在一些常见的与肿瘤或神经系统疾病相关的转录因子,如FUBP1,MSX2等,同时,也发现了较为新颖的、或报道较少的转录因子,例如,ZSCA4、ZN502、ZIM3等。(2)收集肺癌患者的肿瘤组织,利用SALP技术构建文库,之后使用Illumina Hiseq X Ten平台测序,通过生物信息学分析,发现大部分染色质开放性区域位于远端基因间区域其次是内含子区域和启动子区域,在外显子区等分布最少;通过与良性病变组织细胞样本对比,发现相比于良性病变组织,肿瘤组织分离细胞有1131处染色质区域开放状态增高,6812处染色质区域开放状态降低(FDR<=0.05);利用Homer对Peak进行基因注释,发现4807个基因的染色质开放状态发生改变;随后利用PANTHER对这些基因进行GO富集分析,发现这些染色质开放状态发生改变的基因富集在细胞成分运动、分子功能正向调节、刺激反应负向调节、细胞运动、细胞迁移等相关功能;从染色质开放状态发生显著改变的基因中,我们筛选出SEMA4D、EGFR、TERT等33个基因,它们均有报道与恶性肿瘤相关,其中31个已报道与肺癌相关;为探究在肺癌发生、发展过程中差异开放染色质区域调控肿瘤发生的模式,我们通过MEME和DREME两款软件预测de novo motif;利用Centri Mo识别在序列中心区域显著富集的motif;采用Tomtom软件将预测到的de novo motif与HOCOMOCO human v10数据库的已知motif进行比较,确定二者的相似度,从而分析在这些区域上富集的转录因子,对所预测出的转录因子在恶性肿瘤及肺部疾病中的研究现状进行文献复习,发现其中存在一些常见的与肺癌或肺部疾病相关的转录因子,如BACH2、FOSL1、KLF9和E2F2等,同时,也发现了较为新颖的、或报道较少的转录因子,例如SP2、NEYC等。(3)收集上述胶质瘤患者配对的外周血和脑脊液,肺癌患者配对的外周血,使用QIAseq cf DNA Library Kit试剂盒对其中cf DNA进行文库构建,随后进行高通量测序和生物信息学分析。同时对之前研究中获取的染色质开放性区域中的基因突变情况进行分析,并与配对的液体活检样本中基因突变发生情况进行对比,研究胶质瘤和肺癌染色质开放性区域的基因突变情况,确定胶质瘤和肺癌存在较大异质性;同时评估了组织样本和液体活检样本检出基因突变的情况,明确在胶质瘤中,脑脊液是一种相对于血浆更好的液体活检材料;发现由于液体活检和组织活检均存在利弊,在实际检测诊断中,应将二者相结合;本研究还发现在胶质瘤样本中,MUC6基因突变发生频率较高,且突变位点分布较为集中,其在胶质瘤发生、发展中的作用机制有待进一步研究。本研究不仅揭示了在肺癌和胶质瘤发生、发展过程中染色质开放的变化特征、染色质开放状态发生显著改变的基因、可能发挥作用的转录因子以及染色质开放性区域的基因突变情况,还初步探讨了应用cf DNA中染色质开放性区域信息监测肿瘤发生、发展的潜在价值,为这两种恶性肿瘤的新型肿瘤标志物的发现及其在液体活检中的应用提供了新的重要参考。