论文部分内容阅读
随着医学成像技术的发展和普及,医院和医疗研究机构产生的医学影像数据(CT, MRI, X射线等)呈现海量化的增长趋势。如何准确、有效地管理和分析医学影像数据库,是当前生物医学领域的一个关键课题。基于内容的图像检索技术以图像的视觉特征作为依据,快速查询病理相似的临床医学影像,成为计算机辅助诊断和医学研究的重要手段。然而现有的医学图像检索系统存在三方面的问题:首先,医学图像中医学本体属性复杂,不利于发现和描述;其次,图像的底层特征与高层医学语义之间存在语义鸿沟,仅仅采用视觉特征作为相似性匹配和度量的依据,不能有效的表达用户的查询语义;最后,检索过程中忽略了医学病例中包含的文本标注信息及其表达的语义特征。针对以上问题,本文以基于图的半监督学习方法为主要理论基础,重点探讨了医学图像检索中的四个关键环节:结合视觉语义的影像检索、相关反馈模型、基于多模态信息的医学病例检索和高效的检索算法。论文的主要的研究内容和创新性成果如下:(1)提出一种结合视觉语义和局部特征的医学图像检索方法。该方法首先在基于图的半监督学习框架中嵌入结构假设,提出一种加入密度约束的标记传播算法,以获得查询图像的类别归属度作为视觉语义;然后提取图像的Dense SIFT特征生成视觉单词,得到图像的局部特征表示;最后设计基于视觉语义和局部特征的相似性度量方法。实验结果表明,该方法能够有效的表达查询图像的医学语义,检索效率优于单一底层特征检索。(2)根据医师对查询的反馈信息,构建一个基于成对约束传播的相关反馈模型。其基本思路是将正负反馈转化为正负约束并将约束信息传播到整个数据集以重构流形,然后在新流形结构上对医学影像进行有偏的流形排序。本文方法降低了传统相关反馈中的小样本问题和不对称训练问题对检索结果的影响。在此基础上,本文提出了基于长期反馈策略的医学检索框架,能够根据历史的查询信息更新检索模型,其检索性能优于其它常用反馈模型。(3)针对计算机辅助诊断中的相似病例查询,提出一种基于多图半监督学习的多模态病例检索算法。该算法将医学影像和文本标注视为相互补偿的不同模态的信息,定义结合视觉特征和文本标注的多图融合的半监督学习框架,目的是根据图正则化模型将不同模态的特征在流形上进行融合,通过在融合图上进行流形排序获得最终的病例检索结果。多个病例影像数据库上的实验结果表明,该算法能够有效地利用影像和文本信息进行病例检索。(4)提出一种面向多特征的快速流形排序算法。计算复杂度是图方法应用于实际数据处理的瓶颈,本文采用锚点图实现对原图的重构,在保持流形结构的前提下简化图模型。本文提出基于序贯融合的多特征检索模型,在降低图的构建和排序计算两方面的复杂度的同时,通过多特征的图像表示来提升流形排序的性能,从而在保持检索精度的情况下大幅度提高检索速度。