论文部分内容阅读
肺癌(Lungcancer,LC)是世界上最常见的恶性肿瘤之一,由于缺乏有效的早期诊断方法,其五年生存率较低,仅为19.8%,因此寻找一种有效且低损低耗的早期检测方法具有重大意义。近年来研究表明,肿瘤相关抗原(Tumor associated antigen,TAA)在多种肿瘤患者血清中异常表达,可以引发自身免疫反应,产生相应的抗肿瘤相关抗原自体抗体(Anti-tumor associated autoantibody,TAAb)。相较于TAAs,TAAbs在血清中更稳定且更持久,具有成为肿瘤血清标志物的优势。目的通过蛋白质芯片筛选,间接酶联免疫吸附测定(Enzyme-linked immunosorbent assay,ELISA)实验验证得到对肺癌具有诊断价值的候选TAAbs,运用多种数据挖掘技术构建肺癌自身抗体诊断模型,并比较各个模型对肺癌的诊断价值,从而获得一种能对早期肺癌进行高效诊断的模型。方法1)蛋白质芯片筛选TAAbs基于138个癌症驱动基因定制蛋白质芯片,对100例肺癌患者和50例正常对照(Normalconrtol,NC)血清中的自身抗体进行检测,应用多种数据分析方法对结果进行筛选,最终获得具有潜在诊断价值的候选TAAbs。2)间接ELISA进行TAAbs的检测间接ELISA检测155例新发肺癌患者和155例正常对照血清标本中候选TAAbs的含量并比较两组间差异,绘制受试者工作特征曲线(ROC),对候选TAAbs的诊断价值进行评估,根据ROC曲线下面积(AUC)>0.5且P<0.05筛选自身抗体。3)间接ELISA在大样本中验证TAAbs诊断价值间接ELISA检测300例新发肺癌患者、144例良性肺部疾病(Benign lung disease,BLD)患者和300例正常对照血清标本中自身抗体的含量,分别比较肺癌组和正常对照组、肺癌组和良性肺部疾病组中TAAbs的差异,进一步的验证TAAbs对肺癌的诊断价值。4)肺癌诊断模型的构建与评估将验证组中研究对象(300例肺癌患者和300例正常对照)随机分为训练集(n=414)和验证集(n=186),训练集用于构建模型,验证集用于评价模型对肺癌的诊断价值;针对实验筛选的TAAbs,运用数据挖掘技术构建肺癌诊断模型,包括Logistic回归分析、Fisher判别分析、决策树(DT)C5.0、人工神经网络(ANN)-多层感知器(MLP)及径向基函数(RBF)和支持向量机(SVM)。通过绘制ROC曲线评估各个模型的诊断价值,并依据AUC、灵敏度和特异度及纳入TAAbs的个数筛选出最佳模型。5)最佳模型在早期肺癌及良性肺部疾病中的应用首先将最佳组合模型分别应用于肺癌早期和晚期以评估该模型的诊断价值,然后将模型应用于良性肺部疾病的鉴别诊断。6)统计方法使用 SPSS 21.0,SPSS Modeler 18.0,GraphPad Prism 5.0 和 MedCalc 11 等软件对实验数据进行统计学分析。利用非参数检验比较肺癌与正常对照,肺癌与良性肺部疾病血清抗体表达水平的差异,通过ROC曲线获得各个自身抗体的AUC、灵敏度、特异度以及95%置信区间(95%CI)。研究均为双侧检验,当P<0.05时有统计学意义。结果1)通过蛋白质芯片筛选出12种TAAbs,包括TP53、P62、NPM1、Survivin、GNA11、SRSF2、HIST1H3B、FGFR2、PBRM1、JAK2、TSC1 和 PIK3CA。2)通过间接ELISA检测,并设置筛选条件AUC>0.5且P<0.05,最终筛选出 8 种 TAAbs(TP53、NPM1、GNA11、SRSF2、HIST1H3B、FGFR2、TSC1 和PIK3CA),诊断肺癌的 AUC(95%CI)的范围为 0.591(0.528-0.654)-0.802(0.753-0.850)。3)通过间接ELISA实验在大样本中的验证,8种TAAbs均符合AUC>0.5且P<0.05。其中 TP53 的诊断价值最高,AUC(95%CI)为 0.751(0.710-0.793),FGFR2 的诊断价值最低,AUC(95%CI)仅为 0.556(0.509-0.602)。4)通过数据挖掘将上述8种TAAbs联合并构建肺癌诊断模型,经对比发现决策树C5.0模型对肺癌的诊断价值最高,共纳入了 7种TAAbs(TP53、NPM1、FGFR2、PIK3CA、GNA11、HIST1H3B 和 TSC1),在训练集中 AUC(95%CI)为0.897(0.863-0.924),灵敏度和特异度分别为94.4%和84.9%;在验证集中AUC(95%CI)为 0.838(0.777-0.888),灵敏度和特异度分别为 89.4%和 78.2%。5)决策树C5.0模型在鉴别诊断早期和晚期肺癌与正常对照组时AUC(95%CI)分别达到 0.886(0.845-0.926)和 0.864(0.826-0.902),在鉴别诊断肺癌和良性肺部疾病时,AUC(95%CI)为0.576(0.510-0.642)。结论1)通过蛋白质芯片技术筛选及间接ELISA验证发现的8种TAAbs(TP53、NPM1、GNA11、SRSF2、HIST1H3B、FGFR2、TSC1 和 PIK3CA)可能成为诊断肺癌的潜在标志物。2)基于 7 种 TAAbs(TP53、NPM1、FGFR2、PIK3CA、GNA11、HIST1H3B和TSC1)所构建的决策树C5.0模型对肺癌具有较高的诊断价值,且对早期肺癌诊断价值更高,对肺癌和良性肺部疾病也具有一定的鉴别作用。