论文部分内容阅读
癌症是人类难以攻克的顽疾,其中胃癌以其高发病率、高致死率高居我国癌症第二位,仅次于肺癌。自20世纪中后期起,研究人员就开始医学图像分割相关技术的研究,希望通过计算机辅助技术减轻病理学家的沉重负担,但是这些算法通常鲁棒性较差,过程复杂且无法提供语义信息。同时,高额的人工标注成本也限制着监督式深度学习在医学图像分割领域的应用。因此,将半监督的深度学习应用于胃癌诊断中,不仅可以挽救无数患者的生命,而且对于节约医疗资源成本,缓解医患矛盾也有重大意义。本文在分析深度学习在国内外医学图像识别研究与应用现状的基础上,对癌症病理切片的分割进行详细的研究,探讨并分析了各种方法的优缺点。本文通过将传统基于图块的图像分割与基于全卷积神经网络的图像语义分割相结合,使用半监督学习探索在粗标记数据集上的图像语义分割方法。同时,本文提出区域重叠预测算法,用于消除图块之间的误差,提升预测效果。为了进一步提升模型的泛化能力与性能,本文在网络模型的后端使用全连接的条件随机场进行后处理,通过计算网络输出的概率图与原图像中像素点之间的颜色纹理的特征之间的关系,为特征相近的像素分配相同的标签。本文还提出了一种迭代学习的学习机制,通过使用已有模型预测训练集并进行处理,反复再训练以提高模型的性能与精度,从而完成图像语义分割的任务。另外,本文针对目前现有的开源数据标注软件用户体验差,标注过程繁琐等缺点,开发编写了一套数据标注软件,以实现高效快捷的数据标注。本文通过训练基于图块的卷积神经网络,使用数字图像处理技术进行预处理,结合全连接条件随机场、区域重叠预测等算法进行后处理,以重复学习的学习机制进行效果优化与提升,结果完全达到预期的目标。在没有任何后续人工标注的情况下达到了 88.31的平均交叉联合度量(IOU),91.09%的平均精确度,并赢得了 2017中国大数据人工智能创新创业大赛的冠军。通过本文的研究,充分证明了在粗标记医学图像上进行半监督学习能够取得接近全监督学习的效果,这将极大的减少模型对于金标准数据集的依赖,节约成本,对于医学图像语义分割方法的发展具有重要意义。本文的主要贡献共有以下几点:1.本文提出重复学习的训练框架,使得网络在没有任何后续标记,不进行任何预训练的情况下,在粗标记的数据集上达到目前最好效果。2.本文结合基于图块与全卷积神经网络进行胃癌数字病理图像的分割任务。3.本文提出一种全新的基于区域重叠预测的算法进行后处理。4.以我们所知,本文是首篇阐述使用深度学习解决胃癌病理切片分割问题的文章。