论文部分内容阅读
目的:根据新辅助化疗后超声肿物大小的变化,探讨运用分类模型预测病理完全缓解(p CR)的可行性及准确性,并对p CR的影响因素进行分析。方法:收集2011年1月至2016年9月吉林大学第一医院乳腺外科乳腺癌新辅助化疗患者的临床病理资料,纳入研究351例患者。患者均在1周期化疗结束后,下次化疗之前行乳腺彩超检查,并记录每次化疗后肿物大小;计算肿块面积(径线×径线),以肿块面积(多发病灶为面积之和)为特征,p CR为类标进行分类;运用机器学习中常用的6种分类算法(SVM,KNN,NBayes,DTree,RF,XGBoost)进行建模预测p CR,6种分类器均采用默认参数。针对入组的所有分子分型,将其6次化疗后肿物的真实面积作为上述6种分类器的特征输入,p CR作为类标进行训练;采取5 fold Cross Validation方法进行交叉验证,并引入混淆矩阵,运用4个指标(Sn,Sp,Acc,Avc)进行评价模型状况;通过穷举方法找出基于每一分子分型的每种分类器而言最好的特征组合并进行排序,从而知道对特定的分子分型最好的分类准确率和特征组合。再以化疗前3次真实肿块面积为特征,p CR为类标进行训练;采取5 fold Cross Validation方法进行交叉验证,引入混淆矩阵进行评价模型状况。运用SPSS(verson.21.0)使用卡方检验对p CR进行单因素分析,必要时行Fisher精确检验,并使用二元Logistic回归进行多因素分析。结果:本研究总体p CR率为22.5%(79/351),Luminal B(Her-2阳性)型p CR率为22.97%(17/74),Luminal B(Her-2阴性)型p CR率为9.74%(15/154),Her-2过表达型p CR率为36.51%(23/63),三阴型p CR率为40%(24/60)。单因素分析显示T、分子分型、ER、PR、Her-2、Ki-67与p CR明显相关,且差异具有统计学意义(p<0.05);多因素分析显示PR及Ki-67是p CR的独立影响因素;PR-更易获得p CR(OR=2.795,95%CI:1.227-6.363,p=0.014);当Ki-67>40%时,Ki-67越高,获得p CR可能性越大(OR=3.561,95%CI:1.496-8.480,p=0.004),T4与T1相比,获得p CR可能性较小(OR=0.093,95%CI:0.011-0.806,p=0.031)。以化疗6次肿块面积为特征进行建模预测p CR时,Luminal B(Her-2阳性)型、Luminal B(Her-2阴性)型、Her-2过表达型及三阴型分别使用RF、KNN、XGB和XGBoost/RF分类算法建模预测p CR效果较好,准确率(Acc)分别为81.07%、89.63%、66.79%和82.98%,通过穷举方法筛选后,四种分子分型预测p CR最佳分类算法分别为SVM、RF、DTree和RF,Acc为83.75%、90.92%、74.87%和84.8%;当以化疗前3次肿块面积为特征进行建模预测p CR时,Luminal B(Her-2阳性)型、Luminal B(Her-2阴性)型、Her-2过表达型及三阴型分别使用XGBoost、KNN、KNN和DTree/XGBoost分类算法建模预测p CR效果较好,Acc分别为74.46%、90.28%、74.62%和76.85%。结论:1、以NAC后肿块面积为特征,p CR为类标,运用计算机分类算法建立模型预测p CR的方法不仅可行,准确率也较高,且不同分子分型最佳分类算法有所不同。2、乳腺超声在预测p CR中具有重要的临床价值。3、不同分子分型p CR率明显有差异,三阴型和Her-2过表达型乳腺癌p CR率更高。4、PR、Ki-67是p CR的独立影响因素,PR(-)、Ki-67高表达的乳腺癌p CR率较高。