论文部分内容阅读
计算机辅助诊断(Computer-Aided Diagnosis,CAD)被称为医生的“第三只眼”,其通过成像技术、图像处理技术以及其他辅助手段,结合计算机的分析计算能力,辅助医生做出诊断,在提高医生诊断准确率、提升工作效率以及帮助患者康复等方面起到了积极促进作用。尽管当前的CAD研究取得了长足的进步与发展,但多数研究局限予对脑CT、脑MRI以及胸部CT数据的研究,关于胃镜影像的研究较少。此外,伴随着环境的污染、生活节奏的加快以及生活压力的增大,胃病的发病率呈现逐年攀升的态势,仅在我国每年就有近40万患者被诊断为胃癌。因此,借助于胃镜影像数据实现对胃病的快速准确诊断治疗具有重要的理论和应用价值。本学位论文分别对胃镜图像质量评价、胃镜视频摘要、图像特征选择以及基于胃镜医学诊断报告的多示例分类问题进行了深入研究,依托于机器学习理论的学习和泛化能力,提出了具有创新性的模型算法。论文的主要内容和创新点如下: (1)针对胃镜图像易受消化道内部食物残渣、消化液以及光照不均等条件的影响,提出了一种基于机器学习的胃镜图像质量评价算法,旨在检测出不包含诊断信息的低质图像,从而有效降低CAD学习算法的复杂度、提升模型准确性。按照造成胃镜图像低质的原因,将图像分为清晰图像、过饱和图像、低照度图像和失焦图像四类,其中后三类为低质图像。对于图像的分类,我们采用了随机森林算法构建稳定高效、无需先验信息的分类器,对低质图像实现了有效检测与剔除。 (2)提出了一种基于相似性抑制字典选择的胃镜视频摘要算法,实现了对于胃镜视频的快速略览。将视频摘要问题转换为稀疏字典选择问题,并在传统模型的基础上,提出了相似性抑制约束,对包含相似性内容的图像约束其同时被选为关键帧的可能性,保证了选取关键帧的多样性。此外,根据人眼视觉特性以及胃镜图像的获取条件,提出了注意力先验,并将其融入到稀疏字典选择模型中,以使选取的关键帧更符合人眼的观测习惯,为医生的诊断提供更多的诊断信息。提出的胃镜视频摘要算法实现了胃镜视频的自动摘要以及关键帧数目的任意设置,不仅可以提高医生的阅片速度,而且可用于医生培训,医学诊断报告生成等实际场景中。 (3)针对医学图像特征表示中,特征维数较高、特征维度间存在冗余及非相关信息,对诊断结果造成干扰,降低诊断准确性的问题,提出了基于群稀疏约束的深度特征选择算法。此外,为了提高算法的适用性,针对训练数据是否存在标签的情形,分别提出了有监督深度特征选择模型以及无监督深度特征选择模型。区分于传统特征选择模型,所提出模型在选取有效特征子集的同时,还为每一特征维赋予合理的权重,从而提高了算法的可扩展性。算法在有效剔除干扰特征的同时还提高了执行效率。 (4)提出了一种基于多示例学习的在线病变检测算法。以胃镜医学诊断报告作为数据源,利用文本匹配算法从诊断文本中提取相应的标签信息。由于诊断报告中包含多幅图像,而提取的标签赋予的是整个诊断报告,故将问题转化为多示例学习问题。为了形成对于诊断报告有效的特征表示,首先使用提出的多视角投票模型从每个正包中选取最可能病变图像,然后将诊断报告映射到所选取图像组成的特征空间中对其进行表示。最后,采用基于低秩约束的在线度量模型构建分类器实现诊断报告的分类。所提出算法摆脱了对于人工标注样本的依赖便于大规模训练数据的收集,同时训练的在线模型可借助于新样本实现不断更新,提高模型的泛化能力,更符合实际应用的需求。