论文部分内容阅读
胃癌(gastric cancer,GC)是全球常见的一种恶性肿瘤,而中国是世界上胃癌发病率最高的国家之一。胃癌的早期临床症状不明显不易被发现;并且晚期胃癌的5年生存率低,预后差。研究表明提高早期胃癌的诊断率,可明显提高胃癌患者的5年生存率,改善患者预后。但是,目前仍然缺乏有效的非侵入性早期胃癌诊断方法。已经被证实,肿瘤患者机体内含有一组能够与自身抗体发生特异性结合的细胞内蛋白,被称为肿瘤相关抗原(tumor associated antigen,TAA)。由于抗-TAA自身抗体(anti-TAA autoantibody,TAAb)在血清中能够稳定存在,在肿瘤患者出现临床症状之前其表达水平升高,已经被广泛用于肿瘤免疫诊断。
目的:
综合应用多种方法系统的筛选出候选胃癌相关抗原,基于胃癌相关TAAb组合构建多种胃癌诊断模型。通过比较各模型之间的诊断性能,筛选出最优模型,评价最优模型在早期胃癌中的诊断价值,从而为建立一种非侵入性的胃癌诊断技术提供参考依据。
方法:
1.应用蛋白质芯片技术筛选候选胃癌相关抗原
基于125种癌症驱动基因编码的154种蛋白质定制蛋白质芯片,检测154种蛋白质相应抗体在100例胃癌血清和50例正常对照血清中的表达水平。对于获得的数据,利用多种统计学方法筛选出候选胃癌相关抗原。
2.应用血清蛋白质组学技术(SERPA)筛选候选胃癌相关抗原
首先,应用人胃癌AGS细胞全蛋白分别与104例胃癌血清和54例正常对照血清进行免疫印迹杂交,初步筛选含高滴度自身抗体的胃癌血清。
其次,基于双向电泳技术,应用SERPA方法筛选出候选胃癌相关抗原。为了降低漏筛胃癌特异的TAA的可能性,进一步应用文献回溯的方法筛选胃癌相关抗原。
3.验证评价单个候选TAAb在胃癌中的诊断价值
1)确认评价单个候选TAAb在胃癌中的诊断价值:第一阶段诊断试验研究(训练集),纳入胃癌291例,按照性别和年龄频数匹配,纳入291例健康对照。
2)验证评价单个候选TAAb在胃癌中的诊断价值:设计另一独立的第二阶段诊断试验研究(验证集),纳入胃癌142例和健康对照142例(性别和年龄频数匹配)。
应用间接酶联免疫吸附实验(enzyme-linked immunosorbent assay,ELISA)检测候选TAAb在以上866个研究对象中的表达水平。主要应用Mann-WhitneyU检验和卡方检验等统计方法进行统计分析;应用筛检评价指标分别评价每种候选TAAb在训练集和验证集胃癌中的诊断价值。经过以上两阶段的确认和验证,筛选出能够鉴别胃癌和正常对照的TAAb,用于模型的构建和评价。
4.胃癌诊断模型的构建及评价
1)模型的构建:基于训练集中研究对象的TAAb表达水平,分别应用logistic回归分析、递归分割分析(RPA)、支持向量机(surport vector machine,SVM)、最小绝对值选择与收缩算子(least absolute shrinkage and selection operator , LASSO)回归分析方法构建胃癌诊断模型;在构建模型时,应用十折交叉验证方法优化模型参数,以构建最优模型。
2)模型的验证:基于验证集研究对象的TAAb表达水平,用构建的模型诊断研究对象是否是胃癌患者,进而评价模型诊断胃癌的能力。综合比较各模型的稳定性和诊断胃癌的能力,筛选出最优模型。
3)模型的亚组分析:本研究根据收集到患者的临床特征,包括TNM分期、肿瘤直径大小、肿瘤分化程度以及淋巴结转移情况,将胃癌患者分为不同的亚组,评价最优模型在胃癌各亚组中的诊断价值。
结果:
1.应用蛋白质芯片技术筛选出了10种候选TAA:p53,鸟嘌呤核苷酸结合蛋白α11(GNA11),衣被蛋白β1亚基(COPB1),包被体β亚基磷酸肌醇3-激酶(PIK3CA),SET结合蛋白1(SETBP1),成纤维细胞生长因子受体2(FGFR2),丝/精氨酸剪接因子2(SRSF2),激活素受体1B(ACVR1B),多溴蛋白1(PBRM1),GNAS。
2.通过免疫印迹实验,发现蛋白质分子量大约在50kD、60kD以及75kD附近的蛋白条带的抗体在胃癌患者血清中阳性率明显高于正常血清。质谱分析结果显示候选TAA为热休克蛋白A5(HSPA5),也被称为葡萄糖调节蛋白78(GRP78)。相关文献报道的7种胃癌相关TAAb对胃癌具有较高的诊断价值,分别为PTEN、p62、NPM1、c-Myc、MDM2、p16、14-3-3zeta。
3.本研究共验证评价了17种候选TAAs在胃癌中的诊断价值(PTEN、p62、p53、NPM1、c-Myc、p16、14-3-3zeta、HSPA5、GNA11、COPB1、PIK3CA、FGFR2、SRSF2、ACVR1B、PBRM1、GNAS)。结果显示:16种TAAs是潜在的胃癌相关抗原(c-Myc、p62、p16、NPM1、MDM2、PTEN、14-3-3zeta、p53、HSPA5、COPB1、FGFR2、SRSF2、ACVR1B、PBRM1、GNAS、GNA11);在17种TAAb,只有抗PIK3CA自身抗体在两阶段研究中的胃癌血清和正常血清之间的表达水平无差异,其他16种TAAb在训练集中诊断胃癌的AUC范围为0.569-0.712,在验证集中诊断胃癌的AUC范围为0.547-0.750。
4.基于训练集中16种TAAb表达水平,成功构建了logistic回归模型、决策树模型、“黑匣子”模型和LASSO回归诊断模型。在构建的四种胃癌诊断模型中,logistic回归模型在训练集和验证集诊断胃癌的AUC分别为0.864/0.869,0.803/0.695,0.987/0.895和0.847/0.838。应用DeLong检验方法比较同一模型在训练集和验证集诊断胃癌的AUC,结果显示:决策树模型和“黑匣子”模型的P<0.05,模型的稳定性较差,而logistic回归模型和LASSO回归模型的P>0.05,模型较稳定。
5.四种模型中的最优模型为基于8种抗-TAA抗体组合(p53、p16、14-3-3zeta、SRSF2、ACVR1B、FGFR2、COPB1和GNA11)的logistic回归模型,PRE(8TAAs)=1/(1+EXP(-(-8.916+4.069×p53+4.438×p16+6.567×14-3-3zeta-4.069×SRSF2+10.190×ACVR1B-5.761×FGFR2+11.365×COPB1+3.659×GNA11)));其在训练集和验证集中诊断胃癌的灵敏度、特异度、符合率分别为79.1%、78.3%、78.7%和77.7%、81.2%、79.4%。
6.亚组分析显示:构建的logistic回归模型在鉴别有淋巴结转和无淋巴结转移亚组、低分化和中高分化亚组、早期胃癌和晚期胃癌亚组、肿瘤直径小于5cm和大于等于5cm亚组之间的诊断价值时,P>0.05,差异无统计学意义。但是,该模型在早期胃癌(TNM:I-II),无淋巴结转移胃癌、肿瘤直径小于5cm胃癌以及中高度分化的胃癌亚组中,诊断胃癌的AUC范围为0.861-0.897,灵敏度范围为77.2%-85.2%,特异度为79.2%,符合率范围为79.1%-82.4%,表明该诊断模型具有较高的能力鉴别早期胃癌和正常人群。
结论:
1.应用基于125种癌症驱动基因编码的154种人重组蛋白定制蛋白质芯片技术筛选候选胃癌相关抗原是一种可行的方法。
2.应用logistic回归分析、递归分割分析、支持向量机、LASSO回归分析方法构建的四种模型中,基于8种抗-TAA抗体组合的logistic回归模型有较高的能力鉴别早期胃癌和正常人。
3.构建的决策树模型、“黑匣子”模型以及LASSO回归模型对胃癌具有一定的诊断价值,这些模型的构建评价为其在癌症免疫诊断领域中的应用提供了参考依据。
目的:
综合应用多种方法系统的筛选出候选胃癌相关抗原,基于胃癌相关TAAb组合构建多种胃癌诊断模型。通过比较各模型之间的诊断性能,筛选出最优模型,评价最优模型在早期胃癌中的诊断价值,从而为建立一种非侵入性的胃癌诊断技术提供参考依据。
方法:
1.应用蛋白质芯片技术筛选候选胃癌相关抗原
基于125种癌症驱动基因编码的154种蛋白质定制蛋白质芯片,检测154种蛋白质相应抗体在100例胃癌血清和50例正常对照血清中的表达水平。对于获得的数据,利用多种统计学方法筛选出候选胃癌相关抗原。
2.应用血清蛋白质组学技术(SERPA)筛选候选胃癌相关抗原
首先,应用人胃癌AGS细胞全蛋白分别与104例胃癌血清和54例正常对照血清进行免疫印迹杂交,初步筛选含高滴度自身抗体的胃癌血清。
其次,基于双向电泳技术,应用SERPA方法筛选出候选胃癌相关抗原。为了降低漏筛胃癌特异的TAA的可能性,进一步应用文献回溯的方法筛选胃癌相关抗原。
3.验证评价单个候选TAAb在胃癌中的诊断价值
1)确认评价单个候选TAAb在胃癌中的诊断价值:第一阶段诊断试验研究(训练集),纳入胃癌291例,按照性别和年龄频数匹配,纳入291例健康对照。
2)验证评价单个候选TAAb在胃癌中的诊断价值:设计另一独立的第二阶段诊断试验研究(验证集),纳入胃癌142例和健康对照142例(性别和年龄频数匹配)。
应用间接酶联免疫吸附实验(enzyme-linked immunosorbent assay,ELISA)检测候选TAAb在以上866个研究对象中的表达水平。主要应用Mann-WhitneyU检验和卡方检验等统计方法进行统计分析;应用筛检评价指标分别评价每种候选TAAb在训练集和验证集胃癌中的诊断价值。经过以上两阶段的确认和验证,筛选出能够鉴别胃癌和正常对照的TAAb,用于模型的构建和评价。
4.胃癌诊断模型的构建及评价
1)模型的构建:基于训练集中研究对象的TAAb表达水平,分别应用logistic回归分析、递归分割分析(RPA)、支持向量机(surport vector machine,SVM)、最小绝对值选择与收缩算子(least absolute shrinkage and selection operator , LASSO)回归分析方法构建胃癌诊断模型;在构建模型时,应用十折交叉验证方法优化模型参数,以构建最优模型。
2)模型的验证:基于验证集研究对象的TAAb表达水平,用构建的模型诊断研究对象是否是胃癌患者,进而评价模型诊断胃癌的能力。综合比较各模型的稳定性和诊断胃癌的能力,筛选出最优模型。
3)模型的亚组分析:本研究根据收集到患者的临床特征,包括TNM分期、肿瘤直径大小、肿瘤分化程度以及淋巴结转移情况,将胃癌患者分为不同的亚组,评价最优模型在胃癌各亚组中的诊断价值。
结果:
1.应用蛋白质芯片技术筛选出了10种候选TAA:p53,鸟嘌呤核苷酸结合蛋白α11(GNA11),衣被蛋白β1亚基(COPB1),包被体β亚基磷酸肌醇3-激酶(PIK3CA),SET结合蛋白1(SETBP1),成纤维细胞生长因子受体2(FGFR2),丝/精氨酸剪接因子2(SRSF2),激活素受体1B(ACVR1B),多溴蛋白1(PBRM1),GNAS。
2.通过免疫印迹实验,发现蛋白质分子量大约在50kD、60kD以及75kD附近的蛋白条带的抗体在胃癌患者血清中阳性率明显高于正常血清。质谱分析结果显示候选TAA为热休克蛋白A5(HSPA5),也被称为葡萄糖调节蛋白78(GRP78)。相关文献报道的7种胃癌相关TAAb对胃癌具有较高的诊断价值,分别为PTEN、p62、NPM1、c-Myc、MDM2、p16、14-3-3zeta。
3.本研究共验证评价了17种候选TAAs在胃癌中的诊断价值(PTEN、p62、p53、NPM1、c-Myc、p16、14-3-3zeta、HSPA5、GNA11、COPB1、PIK3CA、FGFR2、SRSF2、ACVR1B、PBRM1、GNAS)。结果显示:16种TAAs是潜在的胃癌相关抗原(c-Myc、p62、p16、NPM1、MDM2、PTEN、14-3-3zeta、p53、HSPA5、COPB1、FGFR2、SRSF2、ACVR1B、PBRM1、GNAS、GNA11);在17种TAAb,只有抗PIK3CA自身抗体在两阶段研究中的胃癌血清和正常血清之间的表达水平无差异,其他16种TAAb在训练集中诊断胃癌的AUC范围为0.569-0.712,在验证集中诊断胃癌的AUC范围为0.547-0.750。
4.基于训练集中16种TAAb表达水平,成功构建了logistic回归模型、决策树模型、“黑匣子”模型和LASSO回归诊断模型。在构建的四种胃癌诊断模型中,logistic回归模型在训练集和验证集诊断胃癌的AUC分别为0.864/0.869,0.803/0.695,0.987/0.895和0.847/0.838。应用DeLong检验方法比较同一模型在训练集和验证集诊断胃癌的AUC,结果显示:决策树模型和“黑匣子”模型的P<0.05,模型的稳定性较差,而logistic回归模型和LASSO回归模型的P>0.05,模型较稳定。
5.四种模型中的最优模型为基于8种抗-TAA抗体组合(p53、p16、14-3-3zeta、SRSF2、ACVR1B、FGFR2、COPB1和GNA11)的logistic回归模型,PRE(8TAAs)=1/(1+EXP(-(-8.916+4.069×p53+4.438×p16+6.567×14-3-3zeta-4.069×SRSF2+10.190×ACVR1B-5.761×FGFR2+11.365×COPB1+3.659×GNA11)));其在训练集和验证集中诊断胃癌的灵敏度、特异度、符合率分别为79.1%、78.3%、78.7%和77.7%、81.2%、79.4%。
6.亚组分析显示:构建的logistic回归模型在鉴别有淋巴结转和无淋巴结转移亚组、低分化和中高分化亚组、早期胃癌和晚期胃癌亚组、肿瘤直径小于5cm和大于等于5cm亚组之间的诊断价值时,P>0.05,差异无统计学意义。但是,该模型在早期胃癌(TNM:I-II),无淋巴结转移胃癌、肿瘤直径小于5cm胃癌以及中高度分化的胃癌亚组中,诊断胃癌的AUC范围为0.861-0.897,灵敏度范围为77.2%-85.2%,特异度为79.2%,符合率范围为79.1%-82.4%,表明该诊断模型具有较高的能力鉴别早期胃癌和正常人群。
结论:
1.应用基于125种癌症驱动基因编码的154种人重组蛋白定制蛋白质芯片技术筛选候选胃癌相关抗原是一种可行的方法。
2.应用logistic回归分析、递归分割分析、支持向量机、LASSO回归分析方法构建的四种模型中,基于8种抗-TAA抗体组合的logistic回归模型有较高的能力鉴别早期胃癌和正常人。
3.构建的决策树模型、“黑匣子”模型以及LASSO回归模型对胃癌具有一定的诊断价值,这些模型的构建评价为其在癌症免疫诊断领域中的应用提供了参考依据。