原发性结直肠恶性肿瘤根治术后结局的分类预测模型研究

来源 :重庆医科大学 | 被引量 : 0次 | 上传用户:tony33334444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结直肠癌(CRC)是一种常见的消化道恶性肿瘤,发病率与死亡率均呈逐年上升趋势,已然成为影响人类健康的重要疾病。目前CRC的主要治疗手段为外科手术,但术后仍有一定比例的复发转移风险,且复发转移将严重影响患者预后,故是否能准确预测患者术后结局,采取适当措施就显得尤为重要。国内外已有研究对CRC术后转移风险及结局进行预测,主要采用多因素Logistic回归和COX回归,但这2种方法对样本量要求较高,不宜分析小样本高维数据。近年兴起的机器学习算法,如基于统计学习理论的支持向量机学习算法(SVM)、随机森林算法(RF)则适用于小样本、高维数据的分类问题,可以得到具有较好泛化能力的预测模型。预测模型结合特征选择算法,在降低空间冗余度的同时,还可以降低训练成本。其中Boruta算法通过衡量特征对结局的重要性进行选择,可避免变量之间的相关性,对医学数据较为适用,但目前尚未应用于恶性肿瘤数据的预测。本研究分为两部分,第一部分利用UCI标准数据集进行模拟预测,运用SPSS 22.0软件进行单因素差异性分析,R 3.30进行Boruta特征选择,随后建立SVM模型和RF模型,运用Stata14.0对模型预测效果进行比较,尝试筛选出较优的特征选择方式,第二部分针对抽样采集的CRC预后相关数据,对第一部分筛选得到的模型进行验证,并对CRC术后不良结局进行预测。研究结果显示:(1)针对UCI标准数据集的分类预测结果显示,基于全数据集的RF预测模型(AUC=0.717)效果较好;基于差异性分析的预测效果较好的是Polynomial-SVM模型(AUC=0.756);基于Boruta特征选择预测效果较好的为RF模型(AUC=0.905)。ROC曲线分析显示,不同预处理方法的最优预测模型间存在差异(2x=7.27,P=0.026)。(2)结直肠癌单因素分析结果显示,肿瘤部位、CA-199、CEA、浸润深度、神经浸润、脉管浸润、T分期、N分期、Dukes分期、术后化疗、阳性淋巴数在预后分组间存在差异(P<0.05)。Boruta方法筛选结果显示,CA-199、阳性淋巴数、神经浸润、手术时间、是否化疗、化疗疗程数为影响预后结局的重要因素。(3)对于结直肠癌术后结局预测模型的比较显示,基于全数据集的预测效果最好的为Polynomial-SVM模型(AUC=0.907),基于差异性分析预测效果最好的为Polynomial-SVM模型(AUC=0.911),基于Boruta特征选择的模型其预测效果以RF为好(AUC=0.982),且三种最优模型之间存在差异(2x=7.74,P=0.021)。(4)COX比例风险模型发现,CA-199高(RR=2.002,95%CI:1.143~3.505)、阳性淋巴数(RR=1.244,95%CI:1.141~1.357)、神经浸润(RR=2.206,95%CI:1.130~4.308)、术中放疗(RR=2.098,95%CI:1.191~3.696)为结直肠癌术后结局的可能危险因素。综上所述,基于Boruta特征选择的模型预测效果较基于传统差异性分析的模型预测效果好,Boruta特征选择算法可作为临床数据预测模型前的数据降维方式,以便降低模型复杂度,同时提高预测效果。基于Boruta特征选择的RF模型能在一定程度上预测CRC根治术后结局,对指导临床医生术前干预有所帮助。
其他文献
编者按:2012年省级卫视都面临着复杂且多变的局面,去年广电总局先后出台了限娱令、限广令,因此对电视媒体的节目创新能力、资源的垄断能力、广告资源的开发等提出了更高的要
随着微博影响力的日益增强,微博已经成为最主流的媒体之一,与传统媒体在舆论议程设置上足以分庭抗礼。微博等新媒体已经对传统媒体“舆论源头”的优势构成了极大挑战,成为公
联合国环境署于1988年11月召开生物多样性特设专家工作组会议,探讨一项生物多样性国际公约的必要性.1989年5月建立了技术和法律特设专家工作组,拟订一个保护和可持续利用生物
随着网络的高速发展,网络已经成为大学生获取信息的主要渠道,大学生通过网络娱乐和学习,通过网络了解时事信息。现阶段,大学生的网络政治参与差异较大,有一部分学生比较消极,
农业生产和气侯条件关系极为密切。农业生产的对象是生物有机体,它的生产过程是在外界自然条件下进行的,它所需要的物质是从周围环境中获得的,气候条件直接影响着农作物的生
中央电视台“走基层”的系列报道我基本上都看过,而且看得很系统、很完整。我感觉,这些报道真是取得了极大的成功。这样的新闻报道能起到什么作用?我想,至少有三个方面的作用
本文研究了溶剂浮选法(Solvent Floatation Technique)将小麦种子按蛋白质含量不同进行分组的有效性。(1)进一步阐明,不但在品种内,而且在杂种早代混合群体内,种子的蛋白质含
污染触目惊心的可怕rn(The host) 2007韩国rn2000年,驻韩美军医院的一名美国医生下令一名韩国医生将大批闲置的剧毒甲醛倒入卜水沟流入汉江.2002年,在汉江钓鱼的两个人发现水
~(14)C-多菌灵用硫脲法标记合成,产率51%,含量99%,产品达到放化纯。~(14)C-多菌灵示踪研究表明:水稻叶片和根系均能吸收,并运转积累于植株各部分。~(14)C-多菌灵及其代谢产物