论文部分内容阅读
原发性肝癌是消化系统常见的恶性肿瘤之一,肝细胞癌(Hepatocellular carcinoma,HCC)是其主要的组织学亚型。晚期HCC的五年生存率仅为10%,而如果对早期HCC进行干预,五年生存率可以达到86.2%。因此,HCC的早期诊断可以改善其预后。研究发现,肿瘤患者表现出明确的疾病症状之前的数月或数年,肿瘤相关抗原自身抗体(Autoantibody against tumor associated antigen,TAAb)在血清中的水平已经出现异常,所以TAAb具有成为HCC早期诊断血清标志物的潜力。目的本研究利用人类蛋白质组芯片和生物信息学筛选HCC相关TAAbs。并通过间接酶联免疫吸附试验(Enzyme linked immunosorbent assay,ELISA)验证筛选的TAAbs。探索建立HCC最佳诊断模型。并评价模型诊断早期HCC以及与AFP联合诊断HCC的价值。为HCC无创性免疫学诊断提供理论依据和模型支持。方法1.肝细胞癌相关TAAbs的筛选1)生物信息学筛选肝细胞癌相关TAAbs在GEO数据库中筛选HCC数据集。数据集预处理之后,利用加权基因共表达网络筛选HCC相关的TAAbs。2)人类蛋白质组芯片筛选肝细胞癌相关TAAbs对人类蛋白质组芯片的结果进行统计学分析,以筛选肝细胞癌相关TAAb。筛选条件如下:非参数检验(P<0.05),差异倍数(Fold change>1.2)和阳性率(在HCC组阳性率大于等于50%,在正常对照组阳性率小于等于10%)。3)上述两种方法同时筛选到的生物标志物作为候选的肝细胞癌相关TAAbs。2.使用ELISA验证候选的TAAbs验证集中包含HCC样本和正常对照样本各80例。以验证候选的TAAbs在两组之间的表达是否有差异。评价集中包含HCC样本、肝硬化样本和正常对照各216例和慢性乙型肝炎样本316例。验证候选TAAbs表达水平在从正常到HCC的不同阶段的变化。并评价单个TAAb诊断HCC的能力。3.诊断模型的构建、验证和评价1)将评价集中的HCC和正常对照样本按照7:3的比例分为训练集和测试集。以样本是否被诊断为HCC作为因变量,TAAbs作为自变量,构建HCC的诊断模型。为了构建最佳的诊断模型,我们选择Logistic回归模型、支持向量机的三种模型(线性核函数、径向基核函数和Sigmoid核函数)、人工神经网络和线性判别式共6种模型构建HCC诊断模型。在测试集中验证模型的泛化能力,并选择最佳的模型作为HCC的诊断模型;2)评价最佳模型诊断早期和晚期HCC的能力;3)评价最佳模型诊断肝硬化和慢性乙型肝炎的能力;4)评价最佳模型诊断AFP阳性(AFP+)和AFP阴性(AFP-)组HCC的能力;并评价最佳模型联合AFP诊断HCC的灵敏度。结果1.肝细胞癌相关TAAbs的筛选生物信息学和人类蛋白质组芯片同时筛选到11个HCC相关自身抗体,分别是AAGAB、C17orf75、CDC37L1、DUSP6、EID3、PDIA2、RGS20、PCNA、TAF7L、TBC1D13和ZIC2。2.候选TAAbs的验证在验证数据集中,自身抗体CDC37L1,DUSP6,AAGAB,EID3,PCNA,TAF7L,TBC1D13和ZIC2在HCC和正常两组之间存在差异,而C17orf75,PDIA2和RGS20在两组之间却无差异。在评价数据集中:1)在HCC和肝硬化之间有差异的自身抗体为:CDC37L1、PCNA、DUSP6、TAF7L、TBC1D13和ZIC2;2)8个自身抗体在HCC和慢性乙型肝炎以及HCC和正常之间均有差异;3)8个自身抗体在肝硬化和正常以及肝硬化和慢性乙型肝炎之间均具有差异;4)除抗-PCNA抗体之外,其余7个自身抗体在正常和慢性乙型肝炎之间均无差异。自身抗体CDC37L1、PCNA、DUSP6、TAF7L、TBC1D13和ZIC2被定义为有诊断价值的肝细胞癌相关的TAAbs。它们的ROC曲线下面积(Area Under Curve,AUC)的范围是0.672-0.754。3.HCC模型的构建和评价1)本文共构建了6种模型,Logistic回归模型是最佳的HCC诊断模型:Prediction probability(PP)=1/(1+EXP(-(-4.962+6.399×ZIC2+6.144×CDC37L1+5.949×PCNA)))。将PP的阈值设置为0.5。该模型在训练集中的AUC是0.795,灵敏度和特异度分别是70.9%和73.5%;在测试集中AUC是0.783,灵敏度和特异度分别是70.8%和73.8%。2)Logistic模型区分早期HCC和正常的能力为0.812。灵敏度和特异度分别为82.5%和73.0%。区分晚期HCC和正常的能力为0.779,灵敏度和特异度分别为69.2%和75.0%。3)当以肝硬化人群作为对照时,Logistic模型区分HCC和肝硬化的能力为0.621;以慢乙肝人群为对照,模型诊断HCC的能力为0.732;当以肝硬化、慢性乙型肝炎和正常人群作为对照时,模型诊断该HCC的能力为0.720。4)Logistic模型区分AFP(+)组HCC和正常的能力为0.787,灵敏度和特异度分别为70.5%和74.1%。区分AFP(-)组HCC和正常的能力为0.804,灵敏度和特异度分别为74.4%和74.4%。AFP和Logistic联合诊断早期HCC时,阳性率达到了91.9%,诊断晚期HCC时,其阳性率达到了98.0%。结论1.基于人类蛋白质组芯片和生物信息学筛选以及ELISA验证,得到6个具有诊断HCC的潜力的TAAbs(ZIC2,PCNA,DUSP6,CDC37L1,TBC1D13和TAF7L)。2.基于三个自身抗体(ZIC2,PCNA和DUSP6)构建的Logistic模型具有区分HCC和正常的能力及区分HCC和非癌症患者(肝硬化和慢性乙型肝炎)的能力。3.Logistic模型具有诊断AFP(-)HCC的能力;同时具有诊断早期HCC的能力,特别是与AFP联合使用。