论文部分内容阅读
肺癌是全球范围内最为常见的恶性肿瘤,是一种由多种因素共同作用导致的肿瘤类疾病。其中,公认的最主要因素就是吸烟,但是仅有10-15%的吸烟者最后发展为肺癌,说明个体遗传因素在肺癌的发生和发展中发挥着不容忽视的作用。我们从基因多态位点与肺癌易感性的研究报道中,经一系列筛选,选取了24个肺癌关联的单核苷酸多态(SNP)位点。通过SNPscanTM基因分型技术,基于病例-对照研究的方法,对中国汉族人群中的1597例肺癌患者和2040例性别、年龄与之相匹配的健康对照进行功能和标签SNP位点的肺癌易感性分析。随后选取与肺癌风险显著关联的SNP位点以及吸烟状态、年龄和性别因素,运用Logistic逐步向后回归法进行变量筛选,检测交互作用和分析风险因素累积效应,从而构建肺癌风险预测模型,并用基于受试者操作特征(ROC)曲线下面积(AUC)来评价模型的预测能力。同时,通过把总数据平均分为实验数据和验证数据两个部分,以准确率、敏感度和特异度评价模型的预测效果。多因素降维法(MDR)加以分析和验证交互作用和可靠性。结果显示,Logistic逐步向后回归筛选出8个因素变量,其中包括性别、吸烟和6个SNP位点(TERT基因上的rs2736098和rs2853668、BAG6基因上的rs2242656、MMP2基因上的rs243865、CHEK2基因上的rs2236141以及XRCC6基因上的rs2267437)。其中TERT-rs2736098、BAG6-rs2242656、MMP2-rs243865、 CHEK2-rs2236141和KRCC6-rs2267437位点为隐性遗传模型;TERT-rs2853668位点为显性遗传模型。TERT-rs2736098和CHEK2-rs2236141突变纯合子个体的肺癌风险显著提高(rs2736098(TT)校正OR(95%CI)=1.25(1.01,1.54),P=0.038;rs2236141(TT):校正oR(95%CI)=2.03(1.31,3.16),P=0.002). TERT-rs2853668野生等位型携带者以及BAG6-rs2242656、MMP2-rs243865和XRCC6-rs2267437位点野生纯合子个体的患病风险率显著提高(rs2853668(TT+GT):校正OR(95%CI)=1.20(1.04,1.40),P=0.017;rs2242656(AA)校正OR(95%CI)=1.22(1.04,1.43),P=0.017;rs243865(CC):校正OR(95%CI)=1.36(1.13,1.64),P=0.001;rs2267437(CC):校正OR(95%CI)=1.28(1.10,1.50),P=0.002)。基因-基因间和基因-环境间没发现显著的两因素交互作用,6个SNPs位点分别与肺癌发病独立相关,且统计学上有显著性(P<0.05)。6个SNPs口吸烟因素累加产生肺癌风险关联的累积效应,个体携带5个或更多肺癌风险因素时,其患肺癌的风险是携带1个或更少者的4.5倍(校正OR(95%CI)=4.50(2.93,6.91),P=5.8×10-12)。性别、吸烟和6个SNP位点构成的环境-遗传肺癌风险预测模型的预测效果最佳(AUC(95%CI)=0.63(0.61,0.65),P=2.2×10-38),显著优于人口学模型(AUC(95%CI)=0.51(0.49,0.53),P=0.307)、遗传变异模型(AUC(95%CI)=0.56(0.54,0.58),P=2.4×10-10)和非遗传模型(AUC(95%CI)=0.60(0.58,0.62), P=4.9×10-25)。这8个因素,在实验数据中预测指标为:准确率为60.97%,敏感度为44.68%,特异度为73.73%;在验证数据中预测指标为:准确率为61.77%,敏感度为36.84%,特异度为81.27%;总数据中预测指标为:准确率为61.37%,敏感度为40.76%,特异度为77.50%。MDR分析同时验证了我们模型的可靠性。本研究,在中国汉族人群中,初步建立了肺癌风险的环境-遗传预测模型,该模型具有一定的肺癌风险预测能力,对肺癌的预防和诊断工作有辅助作用。因此,更多肺癌关联的基因多态位点有待识别,以完善肺癌风险预测模型。