论文部分内容阅读
医学图像是临床诊断中不可或缺的工具,但解读医学图像并给出诊断结论是劳动密集型工作,迫切需要一种高效的计算机辅助诊断系统,帮助临床医生更好的判读和决策。深度学习的最新进展,使我们能够重新思考基于医学图像的计算机辅助诊断方法,尽管临床正在接受基于深度学习的计算机辅助诊断实践,但是缺少具有可信赖标签的大型数据集,被认为是在医学图像计算机辅助诊断应用中,成功部署深度学习方法所面临的最大挑战之一。本文以乳腺超声图像计算机辅助诊断为切入点,围绕乳腺超声图像中的肿瘤定位检测、噪音标签样本学习、少样本学习、置信度校准进行研究。本文的主要贡献和创新点如下:(1)为了进行乳腺超声图像的肿瘤区域(ROI)检测,分析了最新的各种基于深度学习的目标检测框架,研究了如何利用深度学习方法对乳腺超声图像中的肿瘤区域进行检测。鉴于乳腺超声图像无开源数据集的问题,联合四川省人民医院超声科专家,收集及标注了用于乳腺超声图像肿瘤区域检测的数据集。在新收集的数据集上对适用于乳腺超声图像ROI检测的不同方法进行了系统的评估,并为新收集的数据集建立了基准。(2)为了解决具有噪音标签的乳腺超声图像ROI分类问题,本文提出一种标签分布修正方法(COLC-Net)。乳腺超声图像BI-RADS评级表示的是肿瘤恶性可能性,天然适合改造为标签分布方式进行噪音标签问题优化,基于此,本文为乳腺超声图像设计了软标签。另外不同的分类器可以生成不同的决策边界,并具有不同的学习能力,为了对乳腺超声的软标签进行修正,COLC-Net采用网络协作框架,在每个批次的训练中,从两个网络中蒸馏优秀知识,并动态修正软标签,从而来阻止过拟合噪音标签,及强化准确标签的学习。(3)为了解决具有噪音标签的完整乳腺超声图像分类问题,本文提出了一种高效的方法,称为噪音过滤器网络(NF-Net)。具体来讲,NF-Net采用Double-softmax分类模块,Double-softmax设计显著降低了深度模型的训练速度,从而阻止了它们记忆噪音标签的训练数据。但是Double-softmax缓解噪音标签过拟合的同时也会降低准确标签的学习速度,为了增强准确标签的学习效果,设计了师生蒸馏模型,在此模型中,与使用Double-softmax的学生网络相反,教师网络使用单个softmax层预测训练数据的良恶性标签,并通过蒸馏损失函数进行师生网络间的知识蒸馏。另外在教师网络中加入了类间均衡正则化,通过最大化具有高置信度预测的训练样本的边际类分布熵,让带有准确标签的训练样本更好的在类别间均匀分布,类间平衡正则化可以提高教师网络的预测质量,同时通过蒸馏损失提高学生网络的预测质量。(4)为了解决少样本乳腺超声图像良/恶性肿瘤分类问题,提出了一种整合不同形态领域知识的孪生整合学习框架(SIMK-Net)。不同于传统的孪生网络,SIMK-Net的两个分类器分别处理不同的标签,将准确标签和有噪音的标签统一建模,并对噪音标签引入软标签,从而利用准确标签动态修正软标签值,即通过最小化软标签和网络预测的均方差损失,对软标签分类器进行优化。随着软标签准确度的提升,可以使得网络从超声科医生的专业角度,学习到更加丰富的特征,提升泛化能力,从而可以提升活检标签分类器的分辨能力。迭代进行,两个分类器互相提升能力,能够在训练数据较少的情况下,站在不同医学专业知识角度,学习更多乳腺超声图像可概括的特征表示,以防止过拟合,从而提升模型的整体能力。(5)为了解决基于乳腺超声图像的计算机辅助诊断系统无法给出可靠置信度的问题,提出了一种网络训练和后处理相结合的基于投票的置信度校准方法(KDRV-Net)。该方法中首先利用置信度和网络交叉熵损失的相关性,提出了知识辨别风险网络,在每个批次的训练过程中,选择置信度高的样本参与网络的参数更新,从而提升了网络的识别准确率和相对置信度的可靠性;然后基于BI-RADS评级的特点,利用验证集对置信度边界进行校准;最后提出了置信度投票校准方法,将训练集划分为不同的子集,通过训练的子模型对输出结果进行投票,并结合边界校准对置信度进行最终校准。