论文部分内容阅读
病理切片是临床疾病诊断的金标准,病理医生通过对病理切片进行镜检,完成病理诊断和预后评估,整个过程对于病理医生而言既费时费力又富有挑战。近年来,随着数字病理切片在病理诊断中的不断应用,机器学习方法走进了病理领域,并且推动着病理分析逐渐从定性分析向定量分析转变。计算机辅助数字病理分析能够帮助病理医生克服人工诊断易受认知能力、主观经验、疲劳程度等诸多因素影响的情况,同时可以有效提高病理诊断的准确率和稳定性,减少误诊和漏诊,对病情诊断和治疗方案的选择都有着重大意义。目前,无论是传统的机器学习还是最近发展的深度学习在病理图像分析中均展现出了巨大潜力,但由于计算机辅助病理诊断临床应用需满足各种更为精细化的要求和缺少标注数据等挑战,多数已有研究方法仍然无法满足临床应用的要求。本文基于这一现状,进一步探究了病理图像的精细化分析,主要内容包含如下:(1)针对临床病理诊断的高效性要求,本文提出了一种新的分布式并行方法,即采用数据和模型同时并行的方法来完成骨骼肌病理图像的快速分割。基于Spark云平台,采用master-worker并行的方式,并在每个worker节点上,首先采用具有快速并行预测功能的结构化随机森林边缘检测器检测边缘,然后使用超像素方法生成候选区域,最后利用条件随机场算法提出了一种基于层次树的区域选择算法,同时利用多核编程技术做了进一步并行化。通过实验证明,本文所提出的并行方法相较于单机模式在大尺度骨骼肌病理图像分割中实现了10倍的速度提升。(2)针对临床病理诊断的高精确性要求,本文提出了一种基于深层次连接网络的全场骨骼肌病理图像精细分割算法。所提出的深层次连接网络通过在编码器模块的不同层加入具有独立损失函数的解码器来实现多尺度预测,并将多尺度预测结果组合后生成更鲁棒的精细分割,有效地解决了现有端到端卷积神经网络在细胞分割时输出相对粗糙的问题,最后采用一种两阶段学习策略来有效地训练所提出的深层网络。通过在骨骼肌病理图像数据集上的实验证明了与其他现有方法相比,本文的方法在分割效率和准确率上均有显著的提高。(3)针对缺乏大量已标注病理图像这一挑战,本文提出了一种新的基于半监督深度线性判别分析的组织病理图像分类算法。首先将深度神经网络的损失函数替换为线性判别分析的损失函数,目的是生成具有最小化类内距离和最大化类间距离的特征,同时构建一个鲁棒且有效的图拉普拉斯;然后利用已标注和未标注图像特征构造的图(Graph)来设计一个新的损失函数,并将其作为深度神经网络的损失函数;最后利用网络所生成的特征完成分类。通过在骨骼肌和肺癌病理图像上的验证实验证明了本文方法优于多数现有方法。(4)针对临床病理诊断的高实用性要求,本文提出了一种基于深度学习的肺癌生存分析模型。首先提出采用带有全局平均池化的深度神经网络构建端到端的细胞特征学习模块,并使用基于局部约束线性编码和词袋编码算法将细胞级特征聚合到患者级的特征向量;然后提出基于弹性网络惩罚的Cox比例风险模型,并将其应用于特征选择和生存分析;最后还提出了一种生物标志物的可视化方法来帮助医生定位那些有助于生存分析模型决策的图像区域。通过大量的验证实验证明了所提出的生存分析模型对TCGA肺癌数据集具有良好的预测能力。