论文部分内容阅读
研究背景:近年来结直肠癌在我国的发病和死亡均呈现持续上升趋势,成为我国近十五年来发病和死亡上升速度最快的恶性肿瘤。而结直肠癌发病率和死亡率居高不下的原因主要在于结直肠癌发病遗传机理方面的研究一直没有大的突破。最近的全基因组关联性研究发现了12个结直肠癌易感性位点,为结直肠癌分子病因学研究提供了新线索,其中6个位点处于TGFp信号网络,提示TGFp信号网络的基因多态对结直肠癌发生发展具有重要影响。研究目的:1.分析TGFβ信号网络基因多态与结直肠癌发病风险的关联;2.探讨TGFβ信号网络基因多态与结直肠癌转移风险的相关性;3.重点分析基因-基因和基因-环境交互在结直肠癌发生、发展中的作用。方法:采用两阶段关联分析策略在武汉地区和北京地区病例-对照人群中系统分析TGFβ信号网络基因多态对结直肠癌易感性的影响;采用病例-病例研究设计在武汉地区结直肠癌患者中探索基因多态在结直肠癌转移中的作用;运用Sequenom MassARRAY和OpenArray中通量分型技术检测TGFβ信号网络关键基因的候选多态性位点;应用Cochran-Armitage趋势检验和logstic回归分析环境因素和基因多态与结直肠癌发生、发展的关联性;采用参数法与非参数法相结合的统计策略,应用logistic回归、MDR和CART分析结直肠癌发生、发展过程中基因-基因及基因-环境交互作用。研究结果:1.在环境因素分析中,吸烟在第一阶段武汉地区和第二阶段北京地区的研究人群中均是结直肠癌发病的主要危险因素,全部研究对象中吸烟者结直肠癌发病风险是非吸烟者的1.83倍(95%CI=1.40-2.38)。2.在结直肠癌易感性分析中,第一阶段检测了81个候选SNP,其中rs10988706、rs6478972、rs11129420、rs948588和rs11874392与结直肠癌发病风险显著相关,。第二阶段成功验证了rs11129420和rs11874392与结直肠癌发病风险的关联性。在全部研究对象中,每增加一个rs11129420 T等位基因,结直肠癌发病风险下降47%(OR=0.53,95% CI=0.40-0.69);每增加一个rs11874392 A等位基因则结直肠癌风险增加41%(OR=1.41,95% CI=1.21-1.63)。3.两阶段的logistic回归分析结果均表明rs6478972与rs11874392之间存在显著的相乘和相加交互(第一阶段:FDR-Pmult=0.033, FDR-Padd=0.021;第二阶段:Pmult=8.817×10-5,Padd=0.006)。第一阶段MDR分析的最佳模型为rs6478972和rs11874392(TA=0.5685,CVC=10/10,Permutation P=0.004);第二阶段的MDR最佳模型则包括了rs11129420、rs6478972和rs11874392(TA=0.5919,CVC=10/10,Permutaiont P<0.001)。另外,第一阶段CART模型主要分支规则包括rs6478972、rs11874392、rs1528734和rs3821671,第二阶段的CART分支规则主要有rs11129420、rs11874392和rs6478972。以上logistic回归、MDR和CART分析结果均说明rs6478972和rs11874392之间存在显著的交互作用。4.在结直肠癌转移风险分析中,logistic回归、MDR和CART共同表明rs11129420多态是影响结直肠癌转移的最主要多态位点,每增加一个rs11129420T等位基因,结直肠癌患者发生肿瘤转移的风险升高80%(OR=1.8,95%CI=1.01-3.21),并且在CART分析中携带rs11129420的AT+TT基因型癌患者发生转移的风险为所有病例中最高(advanced case rate%=71.0)。而在MDR分析中,最佳模型包括了rs1800469和rs235764,模型预测准确性为0.5842,交叉验证—致性达到了10/10,并且具有统计学意义(Permutation P=0.015)。研究结论:1.吸烟是结直肠癌发生的主要环境危险因素;2. TGFβR2的rs11129420和SMAD7的rs11874292是影响结直肠癌易感性的最主要基因多态,并且rs11129420也单独与结直肠癌转移风险相关;3. TGFβR1的rs6478972和SMAD7的rs11874392之间在结直肠癌发生过程中具有显著的交互效应,TGFβ1,的rs1800469联合BMP2的rs235764共同影响结直肠癌转移,说明基因-基因交互作用对结直肠癌发生发展的影响相较单个多态性位点更为深远。创新点:本研究首次在中国人群中系统性分析TGFβ信号网络基因多态与结直肠癌发生、发展风险的关联性。本研究还采用了三种基于不同计算原理的统计方法(LR, MDR, CART)重点分析TGFβ信号网络中基因之间、基因与环境之间交互作用。