论文部分内容阅读
研究目的:肺癌是全球范围内最常见的恶性肿瘤之一,其每年的发病和死亡人数均居各种肿瘤之首.流行病学研究表明,肺癌的发生是环境因素和遗传因素共同作用的结果.据估计,约85%的肺癌发病与烟草暴露有关.同为吸烟者中,不到20%的人发展为肺癌,说明个体对肺癌遗传易感性存在差异.前期,采用全基因组关联研究(Genome-wide association study)策略已经发现了数十个肺癌易感区域,如15q25、5p15和3q28等.据统计,在已经报道的86个肺癌易感性单核苷酸多态性位点中,有76个位于非编码区域,提示非编码区的遗传变异在肺癌的发生过程中扮演重要角色.其中,脱氧核糖核酸酶I高敏感位点(DNase Hypersensitive Site,DHS)是指脱氧核糖核酸酶I超敏感区域,该区域易于受到DNA酶I剪切,是非编码区域的重要组成部分,包含多种调控元件,如启动子(Promoter)、增强子(Enhancer)、转录因子结合位(Transcription factors binding sites,TFBS)等.多项研究表明,疾病(或性状)相关位点富集于DHS区域,且更可能为eQTL(expression Quantitative Trait Loci).然而,目前尚无研究系统地分析DHS区域相关遗传变异与肺癌发病风险的关联.2015年,Maurano MT等利用166个个体以及114种细胞系的DNase-seq数据,通过构建TF-centric模型,发现并公布了483415个可能影响转录因子结合的多态性位点.这一研究发现为我们系统地分析DHS区域内调控性位点与肺癌易感性的关联提供了前所未有的机遇.基于上述研究,我们推测:系统分析DHS区域内的遗传变异,可发现更多非编码区肺癌易感位点,进一步揭示肺癌发生的潜在生物学机制. 研究方法:本研究采用大样本、两阶段病例-对照研究设计,对DHS区域遗传变异与肺癌遗传易感性进行系统筛选和评价,并进一步结合多个功能相关数据库进行功能预测,初步探索DHS相关遗传变异影响肺癌发生的潜在生物学功能.初筛阶段的样本来自于国际肺癌联盟的OncoArray项目.目前,该项目已经整合全球十多个国家的5万余例肺癌及相应对照样本,采用Illumina公司设计的OncoArray芯片进行基因分型.经过前期样本和位点质控后,共有18444例肺癌病例和14027例对照纳入初筛阶段分析.验证阶段的样本来自美国国家癌症研究所(National Cancer Institute,NCI)公布的Division of Cancer Epidemiology and Genetics(DCEG GWAS).经过统一的质控后,共有2427例肺癌病例和1944例对照纳入验证阶段的分析.通过整合Maurano MT等发现的可能影响转录因子结合的位点以及可调控周围基因表达的调控性位点(即eQTL,基于GTEx v6p数据库),系统筛选DHS区域内潜在的调控性位点.最终,共保留20871例肺癌病例和15971例对照对应44619个DHS区域内调控性位点用于关联评价. 对于筛选出的调控性位点,采用SNPTEST(v2.5.4)软件进行单个遗传变异与肺癌发病风险的关联分析,计算各个位点的比值比(odds ratio,OR)以及95%可信区间(95%confidence interval,95%CI).调整年龄、性别以及主成分(principal components),以控制其潜在的混杂.对于初筛阶段发现的显著位点(P≤0.05),进一步纳入验证阶段进行验证.采用Meta分析的固定效应模型合并两阶段的结果.对于合并分析发现的新的肺癌易感位点(满足Bonferroni校正,P≤0.05/44619=1.12×10-6),基于GTEx、HaploReg、3DSNP以及PINES等生物信息数据库进行系统功能注释、转录调控预测及通路富集分析等,以探索潜在的生物学机制.为了评价位点所在基序与肺癌的发病关联,进一步进行基序分析(Motif-based analysis),具体为采用SKAT分析评价同一基序上所有位点的整体效应,以期发现肺癌发病风险相关的基序. 研究结果:初筛阶段,共有3069个SNPs与肺癌的易感性存在显著关联(P≤0.05).这些位点中,157个SNPs在验证阶段的遗传效应与初筛阶段一致,且存在统计学差异(P≤0.05).合并分析结果显示,共有8个SNPs满足Bonferroni校正(rs4886592,rs12459249,rs4886982,rs7182694,rs76681511,rs76412132,rs186332及rs4839323).其中,rs4886592,rs12459249,rs4886982,rs7182694,rs76681511及rs76412132与既往GWAS报道位点间存在一定的连锁不平衡.调整既往GWAS报道的位点后,上述6个位点与肺癌发病风险的关联不再显著.最终,本次研究共发现2个新的肺癌易感位点,分别是:20q13区域的rs186332(C>T,OR=1.17,95%CI:1.10-1.24,P=8.45×10-7)以及1p13区域的rs4839323(T>C,OR=0.92,95%CI:0.89-0.95,P=1.02×10-6).基序分析发现了以JDP2_bZIP_1为代表的10个基序与肺癌的发病风险显著相关,提示与这些基序相结合的转录因子可能在肺癌的发生过程中发挥重要作用.进一步的生物学预测结果表明,本次研究新发现的2个SNPs可影响特定转录因子的结合,并且能够调控周围基因的表达.基于上述结果,我们推测,DHS区域相关遗传变异可能通过影响染色体对特定转录因子的亲和力,从而影响转录因子结合,继而调节下游相关基因的表达,最终影响肺癌的发生. 结论:综上,本研究基于大样本两阶段病例对照研究设计,首次系统评价了DHS区域调控性位点与肺癌发病风险的关联.通过两阶段筛选和验证,发现了2个新的肺癌易感性位点,进一步结合功能预测结果表明这些位点可能通过影响特定转录因子的结合,调节靶基因的表达,从而影响肺癌的易感性.本研究结果为揭示DHS区域遗传变异在肺癌发生过程的作用及生物学机制提供了重要线索.