论文部分内容阅读
随着先进的医疗设备的不断普及,医学图像呈指数形式增长,海量的图像数据给医学领域既带来了机遇,同时也制造的难题。一方面,由于大量医学图像的产生,原有的管理方法已经不能适应,需要一种新技术来有效的管理这些医学图像;而另一方面,作为医学领域的难题之一,肺癌的早期诊断非常重要,确诊后能及时防止肺部结节扩散,可以提高患者的存活率。然而,结节在肺部胸片图像中表现使得医生对其难以辨识,这就需要凭借大量的图像数据,采用模式识别的相关方法,为医生构建一种能自动识别肺部结节所在的辅助工具。针对上述两种不同的医学图像分类问题,本文的主要研究内容有两个:基于多特征融合的医学图像模态分类的方法与基于特征学习的肺结节自动识别的方法。本文首先对两个研究内容对应的研究现状及相关技术分别进行了阐述,然后,对于医学图像多模态分类的问题,本文融合了医学图像的视觉特征和文本特征,采用多核学习方法完成了医学图像的多模态分类的工作,并且,取得的分类准确率为目前同一数据集下最好的结果。关于肺部结节自动识别的问题,本文先通过图像处理技术完成疑似结节检测,接着采用单层的网络结构训练分类模型,然后使用训练出模型进行肺部结节识别,最后取得了较好的识别结果。本文的主要贡献有如下几点:(1)在进行医学图像的文本特征提取时,出现了维度灾难的问题,本文采用了基于信息增益的特征选择算法,实现了文本特征的降维。(2)使用了医学图像的文本特征和四种视觉特征,在对这些特征进行融合时,采用了多核学习的方法,并且取得了很好的分类结果。(3)由于检测得到的疑似结节太多,本文构建了两个分类模型,第一个分类模型用来对肺部结节进行初步筛选,第二个模型是基于第一层错误分类样本训练得到,用于对肺部结节进行最后识别。(4)为了保证第二个分类模型能很好的识别结节,本文采用了无监督的特征学习方法进行特征提取工作,包括Sparse AutoEncoder、RBMs及k-means,然后使用提取到的特征训练该模型,并取得了较好的识别结果。