论文部分内容阅读
乳腺癌是多数国家女性人群中发病率最高的癌症,研究表明,乳腺癌的早期准确诊断并及时治疗能够大大降低其致死率。乳腺X光检查是全世界范围内使用最广泛的早期乳腺癌筛查手段之一,也是唯一被证明可以显著降低乳腺癌带致死率的医学影像学方法。使用乳腺X光进行乳腺癌筛查时,会产生一系列乳腺X光图像数据,放射医师根据这些图像数据进行良恶性诊断,而诊断结果与医生个体经验水平有着直接联系。随着计算机技术的发展,计算机辅助诊断系统开始被用于辅助医生诊断疾病。基于乳腺X光图像的计算机辅助诊断系统能够提升乳腺癌的筛查效率和准确率,极大的减轻医生工作负荷,并降低因个体因素带来的结果偏差。在基于乳腺X光图像的乳腺癌筛查辅助诊断系统中,核心部分是乳腺X光图像分类模型。乳腺X光图像分类算法也是当今医学图像分析中的研究热点和难点之一。神经网络方法是一类模拟生物神经网络信息处理过程的计算模型,具有强大的特征提取能力。研究乳腺X光图像分类的神经网络方法具有重要的理论价值和广阔的应用前景。然而现有神经网络方法在乳腺X光图像分析中存在若干不足,如现有神经网络方法对数据依赖性强,而乳腺X光图像数据的获取和标注都存在困难;及乳腺X光图像分类方法的针对性研究还有待提升。本文针对乳腺X光图像数据的特点,着重从减弱数据依赖和获取有效的特征表达两个方面研究面向乳腺X光图像分类的神经网络方法。在减弱神经网络方法的数据依赖性方面:研究多实例数据分类,减轻分类方法对每张图像标签的依赖,进而提出基于特征敏感性的神经网络模型;针对数据集规模大小对神经网络方法产生的性能影响问题,研究乳腺X光图像分类的迁移学习方法。在获取乳腺X光图像有效分类特征表达方面:研究通过优化分类任务中不同类别的类内距离和类间距离来获取可分性更高的乳腺X光图像特征,从而提升分类准确率;针对肿块分类,研究基于先定位后分类的策略,通过定位方法去除无关区域的特征,来提升乳腺肿块分类正确率。本文的创新点和主要贡献包括以下几个方面:·提出基于特征敏感度的特征融合方法,研究多实例乳腺X光图像分类方法。在基于乳腺X光的乳腺癌筛查中,病人一次检查会从多个角度拍摄多张不同视角的图像,然后由放射科医师进行诊断。在一个病人拍摄的多张图像中,若其中一张图像为恶性,则该例病人为恶性样本。对于乳腺X光图像数据,现有方法多是基于单张图像进行判断。该类方法一方面需要对每张图片都进行标注,大大增加了手工标注数据的工作量;另一方面,在智能诊断的过程中,缺少对乳腺X光图像多角度信息的使用。为了克服多实例分类的困难,本文首先收集了一个临床乳腺X光图像数据集。进一步,为了解决多实例分类问题,提出基于图像特征敏感度的特征融合方法。该方法首先对每一例病人的每张实例图像进行特征提取,然后设计一个可学习的滤波器,使用这个滤波器对一例病人中的每个实例特征进行评估。若存在恶性特征则赋予该实例数据一个较大权重,反之赋予一个较小权重。最后根据这些权重对每例病人的多个实例特征进行融合,来得到更具可分性的病例特征。在我们收集的临床数据集和一些公开数据集上进行的实验表明,本文所提出的方法优于其它类似的乳腺癌筛查方法。并且,基于临床数据的研究更具有实际临床应用价值。·提出基于对抗域适应的迁移学习方法,研究基于迁移学习的乳腺X光图像分类方法。神经网络的训练离不开大数据的支撑,而医学数据的一大难点是数据难以获取。在数据量较小时,当前常用方法的效果可能大幅度下降。而迁移学习能迁移其它数据集上学习到的知识到目标数据集上,能一定程度上缓解由于数据集小所造成的性能下降。目前在医学数据分析中,常用的迁移学习方法是直接迁移自然图像中预训练的知识,没有考虑自然图像数据和医学图像数据之间存在的特征差异,如色彩空间、物体形状等。由此,本文提出了基于域适应和迁移学习的乳腺X光图像分类方法。该方法分为两个阶段:1)使用对抗域适应网络,在公开数据集和目标数据集上进行无监督域适应学习;2)将第一阶段学习到的知识迁移到目标分类数据集上,再基于目标分类数据进行微调。第一阶段的无监督域适应方法能够从源域数据和目标域数据中学习到更接近目标数据集的特征知识,降低迁移知识在源数据和目标数据之间的差异。大量实验结果表明本文所提出的方法能够取得更好的分类性能。·提出基于多分类器约束的方法,研究乳腺X光分类问题中的类间方差和类内方差的优化方法。基于乳腺X光图像的乳腺癌筛查本质上是对乳腺X光图像进行良恶性分类。要提高分类结果就要求特征提取网络能够得到判别性较强的特征表达。本文提出一种多分类器约束方法,通过对两个分类器的决策边界进行约束,使得该方法的特征提取网络能够获得类间距离更大、类内距离更小的特征表达。同时,两个分类器能够检测分类结果不一致的样本。这些样本的特征表达是实际分布在决策边界附近的样本,分类器对这些样本的判断是困难的。通过在训练过程中对该类样本的损失函数进行加权,使得特征提取网络更加关注该类样本的特征。在乳腺X光图像公开数据集上进行实验,验证了本文方法的有效性。·提出增强学习和多任务学习的定位方法,研究对乳腺肿块先定位再分类的方法,提升肿块良恶性分类结果。针对乳腺X光图像中的肿块分类,一种常用的手段是通过定位或者分割手段,将肿块区域单独提取出来再对其进行分类。其中的目标定位方法可以分为两类,自顶向下的方法和自底向上的方法。自顶向下的方法需要从图片中逐步搜索确定出目标所在位置,而增强学习算法能够很好的实现搜索并决策这个过程。现有的基于增强学习的自顶向下方法在神经网络训练过程中,需要存储历史状态并用于训练,而存储的状态本身是一个非平衡的采样,从而导致决策过程难以学习。为了更好的学习目标定位决策过程,我们提出使用多任务学习的方法,使得网络学习过程中受到多任务学习带来的增益。同时在划分多任务时,将原有的不平衡采样打破,使少数采样类独立成一个任务,缓解了不平衡采样带来的性能瓶颈。在自然图像和乳腺X光图像数据集上实验结果表明,本文的方法更能准确的定位到目标所在位置,进而提升了分类准确率。