可变多聚腺苷酸化相关遗传变异与结直肠癌风险的分子流行病学研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:jiangxiuli2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结直肠癌是环境和遗传因素共同作用引起的恶性肿瘤,其高发病率和死亡率给人类健康造成极大危害。因此早期识别结直肠癌高危人群遗传标志物对于癌症预防和治疗具有重要意义。全基因组关联研究(Genome-Wide Association Study,GWAS)已发现超过140个结直肠癌易感位点,在解读结直肠癌遗传易感性方面取得重要进展。然而,研究表明目前所鉴定的易感位点仅能解释部分结直肠癌遗传度,仍有大量易感位点亟待发现。同时,由于大部分GWAS位点位于基因组非编码区,使得对其生物学机制的探究受到限制。可变多聚腺苷酸化(Alternative Polyadenylation,APA)是指前体m RNA在3’端加尾修饰时,受到一些原因的干扰影响多聚腺苷酸化加尾信号(Polyadenylation Signal Sites,PASs)选择,产生具有不同3’端非翻译区(3’untranslated Region,3’UTR)长度转录本的过程。APA作为一种重要的转录后调控机制,能够影响包括癌症在内多种疾病的发生发展,同时位于加尾信号或APA相关调控元件中的遗传变异被发现可导致基因APA过程紊乱进而影响癌症进展。因此,本研究以基因APA事件为癌症发生过程中的中间表型,首先在全基因组范围内系统鉴定影响32种癌症APA过程的遗传变异并将其定义为癌症APA数量性状位点(APA Quantitative Trait Loci,apaQTL)。随后基于结直肠癌apaQTL分析结果,并结合大样本量病例对照研究及多种分子生物学实验系统探讨可变多聚腺苷酸化相关遗传变异与中国人群结直肠癌发病风险的关联及其潜在生物学机制,进一步揭示结直肠癌遗传易感性,为高危人群的识别提供重要线索和依据。本论文共包括以下两部分:第一部分多癌症中可变多聚腺苷酸化相关遗传变异的鉴定及特征分析目的:整合基因组、转录组及表观基因组等多组学数据,在32种癌症中鉴定可影响APA过程的遗传变异,从而为阐明遗传变异在癌症中的作用机制提供新的方向。方法:首先从癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库中获取32种癌症样本的基因型数据、转录本APA数据以及样本其他临床信息(年龄、性别、肿瘤分期)。通过线性回归分析,在校正一系列混杂因素后系统分析基因型与转录本APA水平之间的关联,以错误发现率(False Discovery Rate,FDR)<0.05为显著性阈值,鉴定与APA水平显著相关的遗传变异并将其定义为癌症apaQTLs。随后对癌症apaQTLs进行功能特征分析,主要包括癌症apaQTLs位置分布分析、RNA相关特征分析、染色质开放调控元件富集分析、癌症apaQTL相关基因(apaQTL-related genes,a Genes)功能富集分析以及GWAS区域富集分析。结果:1.利用TCGA数据库中32种癌症类型共9 082例样本的基因型和转录本APA数据进行关联分析,在校正年龄、性别、肿瘤分期和人群结构等协变量后,总共鉴定得到703 331个癌症apaQTLs与16 571个APA事件显著相关(FDR<0.05)。2.进一步对703 331个癌症apaQTLs的属性特征进行系统注释。首先位置分布注释发现相较于非apaQTLs,apaQTLs主要富集于3’UTR,且更多地分布在转录终止位点附近。从机制角度分析,癌症apaQTLs可能通过改变多聚腺苷酸化加尾信号、RNA结合蛋白(RNA Binding Protein,RBP)和染色质开放调控元件结合位点进而影响基因APA过程。此外,癌症a Genes被发现显著富集于癌症关键信号通路中。最后通过对癌症apaQTLs数据和癌症GWAS数据进行联合分析,发现与非apaQTLs相比,癌症apaQTLs在GWAS区域显著富集,同时其在解释癌症遗传度方面也具有一定贡献。结论:本研究基于TCGA数据库中多组学数据,构建囊括32种癌症类型的apaQTLs图谱,并对其功能特征进行系统注释。研究成果不仅提供丰富的癌症apaQTLs资源库,更为癌症病因学研究提供重要科学依据。第二部分可变多聚腺苷酸化相关功能性遗传变异与中国人群结直肠癌风险的关联及机制研究目的:基于论文第一部分鉴定得到的结直肠癌apaQTLs结果,同时利用病例对照研究及生物学功能实验系统识别影响中国人群结直肠癌发病风险的功能性apaQTL位点,并阐明其致病的生物学机制,从而进一步揭示结直肠癌遗传易感性。方法:基于第一部分结直肠癌apaQTL分析结果,首先对结直肠癌apaQTLs进行功能特征系统注释,包括位置分布分析、RBP和染色质开放调控元件富集分析、a Genes功能富集分析以及GWAS区域富集分析。接着,整合结直肠癌apaQTLs和欧洲人群结直肠癌GWAS数据(包括17 789例病例和19 951例对照)筛选得到潜在致病位点。随后利用两阶段、多中心病例对照研究验证潜在致病apaQTL位点与中国人群结直肠癌发病风险的关联,第一阶段样本收集于北京地区共1 524例病例和1522例对照,第二阶段样本收集于武汉地区共4 500例病例和8 500例对照。最后通过一系列分子生物学实验,如c DNA 3’末端快速扩增实验、RNA-蛋白体外结合实验、CCK-8细胞增殖和克隆形成等实验深入探究致病apaQTL位点影响靶基因APA过程和结直肠癌发病风险的生物学机制。结果:1.基于第一部分结直肠癌apaQTL分析,共鉴定得到24 681个apaQTLs影响了704个基因的725个APA事件(FDR<0.05)。2.对上述24 681个结直肠癌apaQTLs进行功能特征分析发现:首先相较于非apaQTLs,apaQTLs在3’UTR和基因下游均显著富集(P<0.0001)。此外,apaQTLs还富集于多种RBP和染色质开放调控元件结合位点中(组蛋白修饰和转录因子,P<0.0001),靶基因功能注释发现a Genes富集于结直肠癌相关信号通路中。最后,整合结直肠癌apaQTLs和GWAS数据发现:与非apaQTLs相比,结直肠癌apaQTLs在GWAS区域显著富集(OR=3.08,95%CI=2.83-3.36,P<0.0001)。3.欧洲人群GWAS研究共鉴定得到1 201个与结直肠癌发病风险相关的apaQTL位点。其中位于12p11.21区域的rs1020670具有最显著的基因APA水平调控效应,可能影响靶基因DNM1L的APA过程,因此挑选rs1020670作为候选潜在致病位点。随后两阶段病例对照研究发现,rs1020670(C>G)与中国人群结直肠癌发病风险相关,相较于C等位基因携带者,G等位基因携带者结直肠癌发病风险显著升高(OR=1.22,95%CI=1.13-1.32,P=1.35×10-6)。4.生物学功能实验发现:rs1020670[G]通过促进RBP CSTF2T的结合使靶基因DNM1L 3’UTR缩短进而增加m RNA稳定性,最终导致其m RNA和蛋白表达水平上调。同时基因差异表达分析结果提示相较于癌旁组织,DNM1L在结直肠癌组织中表达水平增高,且进一步实验证明DNM1L的表达上调能够显著增加结直肠癌细胞增殖能力。结论:本研究基于结直肠癌apaQTL分析结果,结合人群流行病学研究,鉴定得到遗传变异rs1020670与中国人群结直肠癌发病风险显著相关。生物学功能实验证明,rs1020670(C>G)突变能够导致由CSTF2T介导的靶基因DNM1L异常可变多聚腺苷酸化,上调致癌基因DNM1L的表达水平,进而增加个体罹患结直肠癌风险,研究结果进一步揭示结直肠癌遗传易感新机制。
其他文献
拉曼散射是一种光子的非弹性散射,带有散射体的结构信息,是物质分析的重要工具。但通常拉曼散射截面较小,特别是气体的自发拉曼散射,信号微弱,容易受光学元件、气体容器等部件的荧光或拉曼背景信号的干扰。为减少背景信号的影响,提高气体拉曼检测的灵敏度和分辨率,本文开展负曲率空芯光纤增强的气体受激/相干拉曼研究。自行搭建了多种中心波长的可调谐单频外腔半导体激光器,结合可调谐染料激光器、锁相放大器、深冷CCD探
学位
AlGaN基深紫外发光二极管(LED)因其结构小巧、功耗低、安全环保、开启时间短及波长可调等特点,被广泛应用于杀菌消毒、气体检测、医疗光疗、安全通信等领域。特别是气体检测领域,具有高光子能量的短波紫外光源激发金属半导体氧化物传感材料,可实现室温ppb级别气体检测,适用于易燃易爆、生物领域等特殊环境检测。因此,深紫外LED将成为目前室温或低温光激发传感器必不可少的光源部分。但由于器件内部电流拥堵严重
学位
光学荧光显微成像技术凭借特异性的荧光标记,成为了研究细胞器生命活动的重要工具。光片显微技术凭借层析精度高,成像速度快,光毒性低等优势,广泛应用于活细胞成像。然而,当前主流的光片仍存在空间占空比不高、旁瓣过高等问题,限制了光片显微技术对亚细胞结构的高层析精度、长时程观测。此外,由于衍射极限的存在,光学显微技术的分辨率不能随着倍率的增加而无限增大,因而无法对亚细胞结构实现更精细的观测。如何在后期图像处
学位
复杂产品的追赶是最近备受学界和业界关注的议题。随着中国制造业快速发展,复杂产品领域的相关企业获得外源性技术的难度越来越大,企业必须从基于增量创新的技术学习向基于根本创新的技术学习转变。同时,与复杂产品相关的国际贸易地理结构过于集中,结构洞指数与世界发达国家存在差距,有必要推动复杂产品企业的市场追赶来提高国际竞争优势。技术和市场双重转型标志着企业进入新追赶阶段。因此本文提出“新追赶阶段复杂产品领域后
学位
近年来,稀土发光与其他学科交叉发展成为一个重要研究领域,以铁电体材料和玻璃材料作为掺杂基质的光电子材料,已成为推动信息化的基础材料。大容量光通信技术的发展对光电子器件的工作带宽提出新的要求。因此在基质材料中精确调控Er3+的发光性能,实现Er3+在光电器件中的波长频移和带宽扩展具有重要意义。本论文首先介绍了掺Er3+材料的制备方法,分别采用溶胶凝胶法和改进的气相沉积方法将Er3+引入铁电材料和光纤
学位
高通量技术的发展给医学研究带来了巨大变革。跨多种细胞功能的多组学数据为了解复杂性疾病的生物学特征提供了无可比拟的机会。本文以血管肉瘤和新型冠状病毒肺炎(Coronavirus disease 2019,COVID-19)为研究对象探讨如何通过多组学数据分析疾病的分子机制、诊断、预后等,为疾病的治疗提供依据。1全基因组和全外显子组测序技术研究血管肉瘤分子机制目的:利用全基因组和全外显子组测序解析血管
学位
学位
以比特币为代表的区块链早期时代,区块链应用主要集中在数字货币领域。自从第一个智能合约区块链平台以太坊发布以来,由于有了图灵完备的智能合约的支持,区块链开始在各大领域广泛应用。然而,智能合约的安全问题却造成了巨额的资产损失,打击了用户对区块链的信心。以太坊作为目前流行的智能合约区块链平台之一,成为了学术界、工业界的研究热点。以太坊智能合约安全形势严峻的根源主要为以下三点:一是开发者对新型的合约编程语
学位
无论是在发达国家还是在发展中国家,企业违规都是一个广泛存在的问题,各国政府也一直在努力治理企业的违规行为。由于我国处于经济转型期,随着资本市场的发展,报刊和自媒体上不断出现有关企业财务造假、虚假披露、虚增利润等违规事件的新闻。企业违规会损害投资者的利益,破坏资本市场秩序,对我国市场经济和法治建设构成了挑战。鉴于这一问题的重要性,国内外学者从社会环境、企业特征以及高管特征三个层面识别了影响企业违规的
学位
代谢综合征(metabolic syndrome,Met S)是以中心性肥胖、血脂异常、高血压、高血糖为主要特征的一系列代谢紊乱的症候群。近年来,Met S的发病率和患病率连年攀升,已呈现全球流行趋势。研究表明,Met S可显著增加心血管疾病和糖尿病发病风险及全因死亡风险。因此,识别Met S的影响因素并进行有效防控,已成为降低心血管疾病和糖尿病负担、促进人类健康的重要手段之一。必需微量元素作为人
学位