论文部分内容阅读
目的:原发性肝癌越来越受到社会的关注,通过分析肝癌患者肝切除手术前的临床资料比较肝癌患者的临床特点、分析不良预后因素、建立预后预测模型,将有利于为肝癌患者的个体化辅助治疗提供一定的参考,提高肝癌患者的预后效果。方法:对386名原发性肝癌患者的34个基线临床资料进行主成分分析和聚类分析,再使用Kaplan-Meier方法和Cox比例风险模型比较患者的临床信息特点和预后差异;使用多重支持向量机递归特征消除方法对进行过肝切除手术的原发性肝癌患者的临床变量进行重要特征排序,使用5折交叉验证的支持向量机确定最优特征子集,构造原发性肝癌患者术后的1年、3年无病生存和总体生存的列线图;使用确定的最优子集构造二元Logistic回归、随机森林、支持向量机、C5.0决策树、神经网络、Bagging算法和Adaboost算法,建立患者肝切除手术后3年无病生存时间和3年总生存时间的预后预测模型。结果:通过聚类分析得到了4组临床表型亚组,4组患者的一些临床表型和预后效果存在统计学差异:第1亚组的患者预后效果最好,第3亚组的预后最差。与亚组1相比,第二亚组的复发风险比为1.32(95%CI:1.03~1.70),第3亚组的复发风险比为3.60(95%CI:1.97~6.58);在考虑死亡风险时,第2亚组的死亡风险提高了1.43倍(95%CI:1.10~1.86),第3亚组的死亡风险是第1亚组的4.11倍(95%CI:2.11~8.00);使用多重支持向量机递归消除的方法对34个变量进行排序,通过与临床医生沟通确认特征排序结果的合理性,患者3年无病生存风险和总生存风险的列线图的一致性指数分别为0.701和0.706;支持向量机和神经网络在预测患者生存和复发上具有较好的准确率,模型的AUC为分别是0.7229和0.7216,其次是二元Logistic回归模型、C5.0决策树、Bagging算法、随机森林、Adaboost算法,其AUC分别是0.7194、0.7091、0.6978、0.6967、0.6571。结论:聚类分析可以得到原发性肝癌患者的临床表型亚组,为术后个体化辅助治疗提供一定的参考;使用多类支持向量机递归消除方法后的预测模型准确率有所提高,列线图在临床实践中能够提供患者生存风险信息,简单清晰的反映患者的生存风险。支持向量机和神经网络在预测患者生存和复发上具有较好的准确率,可用于辅助医生判断患者预后情况及治疗效果。