论文部分内容阅读
随着X射线(X-Ray)、计算机断层扫描(Computed Tomography,CT)和核磁共振(Magnetic Resonance,MR)等成像模式在临床的广泛应用,医学影像大数据的检索与利用已成为当前研究热点。医学图像可为临床诊断提供重要影像学信息,如何解决临床医师从海量图像库中快速准确检索到所需图像是当前一项重要研究课题。在传统的基于内容的图像检索方法中,主要利用图像的颜色,纹理和形状等特征作为检索依据,然而这类特征与人们所需要的高级语义特征存在“语义鸿沟”,所以检索性能一直受限。近年来,随着深度学习技术在各大计算机视觉比赛中取得突破性进展,其良好的特征表达能力已经在自然图像检索领域中也表现出了优异性能。因此,深度学习技术给医学图像检索带来巨大契机。与自然图像不同,医学图像检索是一项具有挑战性的任务。其一,医学图像大多数为灰度图像,边界模糊,具有噪声,对比度差,因此传统特征表示方法很难捕捉到其特征的细微差异;其二,同一组织对于不同病人、不同模态、不同成像设备来说其影像存在一定差异,甚至同一模态不同帧之间也可能存在差异;其三,医学图像类别分布不均匀,存在类别不平衡问题。更重要的是数据标签获取需要专业人员参与,数据标注耗费昂贵,很难得到充足的医学图像检索标注数据集。由于传统的基于内容的医学图像检索方法特征表征能力有限,医学图像检索精度和效率很难进一步提高。本论文提出了一种基于深度学习技术的医学图像检索思想,设计并训练了基于卷积神经网络的医学图像检索模型,其主要目的是提高医学图像检索的精度和效率。本论文主要研究内容如下:(1)研究了传统的基于内容的医学图像检索(Content-Based Medical Image Retrieval,CBMIR)算法的优缺点,提出了多特征融合规则,实现了基于多特征融合的医学图像检索算法。CBMIR算法的准确性和有效性取决于特征表示方法和相似度匹配方法。论文分析了颜色特征,局部纹理特征以及HOG特征表示方法。当出现背景复杂,有噪声,或者边界模糊的图像时,单一特征表示方法不具有良好的鲁棒性。因此,根据医学图像特点,提出兼顾灰度和纹理的多特征加权融合规则,来提高特征的表达能力和鲁棒性。实验证实,通过多特征融合的特征表征能力比单个特征表征能力强,在医学图像检索中有更好的准确性。(2)提出并实现了一种基于深度卷积神经网络的医学图像检索方法传统的CBMIR方法容易受特征表达能力的限制而导致检索精确度不高。随着深度学习技术在诸多领域取得突破性进展,卷积神经网络具有很强的语义特征表达能力。因此,我们提出了基于深度卷积神经网络(Deep Convolutional Neural Network,DCNN)的医学图像检索框架。建立并训练了一个深度卷积神经网络分类模型,使用该模型对医学图像特征进行自动提取,然后通过实验比较和分析了采用不同层特征进行检索的性能。对比实验表明,基于深度卷积神经网络的方法将医学图像检索精度从0.86提高到0.93,证实了所提出方法能更加有效。(3)提出并实现了一种基于深度哈希卷积神经网络的医学图像检索高效方法由于传统的CBMIR方法和基于DCNN的医学图像检索方法的特征维度通常比较高,这些由实数表示的高维特征进行距离计算比较耗时,且所占存储空间较大。因此,我们在上述研究的基础上,针对特征计算效率低下及特征无法表述相似语义信息的问题,提出了一种基于深度哈希的医学图像检索算法。该方法能够将图像之间的相似性语义信息压缩到简短的二进制编码里,通过这些简短的二进制编码进行汉明距离计算,从而降低检索的时间复杂度,同时确保了检索精度。实验表明,新提出的方法平均检索一张图像只需要0.037秒,证实了所提出方法有效的提高了医学图像的检索效率。