论文部分内容阅读
结直肠癌是一种高发的癌症,与人们的生活习惯密切相关。结直肠癌分为两种,分别是结肠癌和直肠癌。结直肠癌的早发现早治疗将会很大程度上提高患者的预后效果。对结直肠病理图像当中的不同类型组织成分的分析,以及相关病理组学特征分析对预测患者术后生存状况有着重要作用。通过预测患者治疗后的预后状况,从而可以为医生治疗提供一些指导性建议,辅助医生为患者制定相应的治疗方案,使患者的治疗更加的得当。针对上述的情况,本文对结直肠癌的预后分析主要分为两步,第一步针对结直肠癌全扫描病理图像中的多种组织类型进行分割,方便病理医生进行识别,准确找到感兴趣区域;第二步分析结直肠癌病理图像中的组织成分等相关特征进行预后分析模型的建立,分析患者的生存状况以及生存差异性。在结直肠癌全扫描病理图像多种组织分割中,本文设计一种深度卷积网络DeepTissue Net,用于多种组织的分割。该方法将每一层卷积层输出的特征映射进行连接,保证特征映射的充分利用,同时引入focal loss损失函数缓解样本相似性以及样本不均衡问题。该方法的主要目的是在结直肠癌全扫描病理图像中分割10种类型组织区域,并使用多中心数据验证模型的有效性。以及使用不同扫描仪采集的数据进行验证,分析不同扫描仪的影响。使用其他类型的深度卷积网络对比实验,结果显示本文构建的DeepTissue Net模型更有效。随后利用分割结果进行图像特征计算,本文计算图像特征包括组织比例特征,癌变区域的深度特征,细胞层次的图特征(Graph),簇特征(Clustergraph),Haralick特征,组织层次的纹理特征以及临床特征。使用最小冗余最大相关、威尔科克森秩和检验和t检验三种不同的特征选择算法和支持向量机(SVM)、线性判别分析(LDA)、二次判别分析(QDA)以及随机森林(RF)四种分类器分别进行组合实验预测患者预后的生存状态。之后根据预测结果使用Kaplan-Meier(KM)生存曲线和对数秩检验(Log-Rank test)进行生存差异性分析。实验结果在独立测试集中显示,在预测患者预后生存状态的准确率达81.52%,AUC值为0.77,预测结果进行生存差异性分析显示P值远小于0.00001,通过比例风险回归模型同样也说明预测结果的显著性差异。