论文部分内容阅读
背景和目的结直肠癌(Colorectal cancer,CRC)是我国发病率第3的消化系统恶性肿瘤,易复发转移,目前尚无特异性的治疗方法,患者远期预后差。利用生物学标志物早期筛查和确诊CRC,是提高患者存活率,改善预后的关键。发现和鉴定对CRC有特异性诊断价值的生物学标志物,对于查明CRC的发病机制,研发新的治疗举措和新型药物,推动CRC的诊疗进展有重要意义。本研究利用蛋白芯片结合生物信息学分析筛选结直肠癌患者血清中差异表达蛋白,将筛选出的差异蛋白作为候选,构建支持向量机(Support Vector Machine,SVM)模型预测其对CRC的诊断效能,评估候选蛋白能否作为CRC潜在的诊断标志物或药物靶点。方法1.采集12例临床确诊的CRC患者和同期12例健康对照者的血清标本,用蛋白芯片筛选CRC患者血清差异表达蛋白。2.对筛选出的差异蛋白做层次聚类、功能富集、PPI网络构建、药物-靶基因相互作用网络构建等生物信息学分析;利用TCGA结直肠癌临床数据,将差异蛋白作为候选因子,分析候选因子与患者预后的关系。3.用蛋白检测芯片检测34例CRC患者和34例健康对照者血清中的差异蛋白表达情况,筛选显著差异蛋白;将提取的显著差异蛋白在两组样本中的表达值作为特征值建立SVM诊断模型,通过ROC曲线评价模型对CRC的分类预测效能。结果1.累加强度指标下筛选出6个差异蛋白,酪氨酸蛋白激酶受体(Tyrosine receptor kinase 3,TYRO3)和趋化因子26(C-C motif ligand 26,CCL26)表达上调,肿瘤坏死因子受体超家族成员10C(Tumor Necrosis Factor Receptor Superfamily Member 10C,TNFRSF10C)、巨噬细胞移动抑制因子(Macrophage migration inhibitory factor,MIF)、巨噬细胞刺激蛋白-1(Macrophage stimulating protein,MSP-α)和白介素-16(Interleukin-16,IL-16)表达下调。2.平均累加强度指标下筛选出6个差异蛋白,其中血管生成素-2(Angiopoietin-2,ANG-2),刺豚鼠相关蛋白(Agouti-related protein,Ag RP)、成纤维细胞生长因子-4(Fibroblast growth factor 4,FGF-4)、成纤维细胞生长因子-9(Fibroblast growth factor 9,FGF-9)表达上调,白介素-8(Interleukin-8,IL-8)和血小板生成素(Thrombopoietin,TPO)表达下调。3.平均净累加强度指标下筛选到4个下调的差异蛋白,分别为血管内皮细胞生长因子-D(Vascular Endothelial cell Growth Factor D,VEGF-D)、趋化因子25(C-C motif ligand 25,CCL25)、趋化因子-16(C-C motif ligand 16,CCL16)和白介素-8(Interleukin-8,IL-8)。4.基因本体(Gene Ontology,GO)富集分析显示,差异蛋白主要显著富集在ERK1和ERK2级联的正向调节过程、细胞趋化性过程以及白细胞迁移等过程。京都基因和基因组百科(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析显示,差异蛋白主要富集在细胞因子与细胞因子受体的互作通路、趋化因子信号通路、Rap1、Ras、MAPK等信号通路。5.蛋白质-蛋白质相互作用网络(Protein-Protein Interaction,PPI)中共有12个节点,其中表达下调的有CCL25、CCL16、IL-16、IL-8、VEGF-D、MIF、TNFRSF10C,表达上调的有TYRO3、CCL26、ANGPT2、FGF-4和FGF-9。12个节点之间组成12个PPI关系对。6.药物-基因相互作用(Drug-gene interaction,DGI)分析共得到了5个基因、10种药物和10个药物-基因互作关系对。5种基因分别为TYRO3、MIF、ANGPT2、FGF-4和TPO,10种药物分别为盐酸丙美卡因(Proparacaine)、柠檬酸(Citric acid)、贝伐珠单抗(Bevacizumab)、利巴韦林(Ribavirin)、木聚硫钠(Pentosan polysulfate sodium)、卡比马唑(Carbimazole)、甲巯基咪唑(Methimazole)、丙硫氧嘧啶(Propylthiouracil)、维甲酸(Tretinoin)和右旋甲状腺素(Dextrothyroxine)(表8)。FGF-4-木聚硫钠、TPO-卡比马唑、TPO-甲巯基咪唑和TPO-丙硫氧嘧啶之间为抑制性作用。5.生存分析显示FGF-4与CRC预后相关(p<0.1)。6.15个差异表达蛋白中,5个蛋白在疾病组表达上调,分别为IL-8、MSP-a、MIF、TNFRSF10C和TYRO3;10个蛋白在疾病组表达下调,分别为IL-16、CCL-26、TPO、VEGF-D、CCL25、CCL16、ANG-2、FGF-4、Ag RP和FGF-9。生信分析得到6个显著差异蛋白,分别为IL-8、MSP-a、MIF、FGF-9、ANG-2和Ag RP。7.利用6个显著差异蛋白建立SVM模型,其诊断CRC的AUC面积为0.985,除CRC组的10号、11号和20号样本,其余样本都能根据该模型被正确地分组。结论本研究利用蛋白芯片结合生信分析在CRC患者血清中筛选到15个差异蛋白,其中IL-8、MSP-a、MIF、FGF-9、ANG-2和Ag RP为显著差异蛋白。利用6个显著差异蛋白建立的SVM模型对CRC有较好的诊断效能。