论文部分内容阅读
肺癌是世界范围内导致死亡的最主要原因,而肺癌早期诊断和治疗是提高患者生存率最有效的方法。肺结节是肺癌的早期表现形式,随着计算机断层扫描(CT)成像的发展,CT成为检测肺结节的标准方式,但是肺结节良恶性确诊仍需要进一步的病理检查。因此,数百万的医学CT图像被累积并且需要由放射科医师进一步诊断。面对海量肺部CT影像,计算机辅助诊断系统能够辅助医生进行高效准确的肺结节诊断,减少医生处理数据的工作量。但是目前基于手工提取特征(纹理特征、形状特征、灰度特征)的传统肺结节辅助诊断系统由于无法适应于组织复杂的肺结节,近年来,将深度学习方法应用于肺结节诊断已经成为一种趋势,但在传统的基于深度学习的肺结节诊断方法中存在仅将深度模型作为特征提取工具提取图像特征而忽略先验知识在肺结节诊断中发挥作用的问题。因此,如何将先验知识融合进基于深度模型的肺结节诊断系统中从而进一步提高肺结节的诊断精度变得非常有意义。同时面对大多深度学习模型存在的参数多,训练速度慢的问题,如何可以在保证精度的同时提高训练速度同样是本文的研究重点。深度自编码技术可以通过多层自编码堆叠端到端的从肺部CT图像中学习特征并利用学习到的特征对肺结节进行分类诊断。本文在深度自编码的基础上针对特征提取能力训练速度及特征鲁棒性问题提出广义深度自编码,研究利用广义深度自编码技术实现肺结节的良恶性辅助诊断。本文的主要研究内容和创新如下:(1)由于医学图像难采集困难且标准不一,因此与其他领域数据量相比医学图像的数据量相对较小,导致医学深度学习发展受阻,而数据量的多少决定了深度网络是否能学习到肺结节的复杂特征,因此解决这一问题对肺结节分类诊断具有重点意义。基于此,为了解决由于学习到的肺结节特征不够全面引起的分类准确率不高的问题,提出一种基于多特征广义深度自编码的肺结节诊断方法。首先,通过图像预处理构建肺结节图像的三种数据集作为输入;然后,将流形学习融入基于极限学习机的深度自编码中形成无监督广义深度自编码利用该网络逐层提取特征;最后,通过不同的融合策略得到融合后的特征向量进而通过分类器对肺结节进行良恶性分类诊断。实验结果表明,以先验知识作为引导即以三种图像作为输入相较于单一图像输入可以有效的提高肺结节的诊断准确性、敏感性和特异性。同时融入流形学习形成的广义深度自编码网络较原网络模型有更好地特征提取能力。(2)基于双线性模型可以有效地用于特征表示,为了进一步提高广义深度自编码的稳定性与特征提取能力,克服基于极限学习机的自编码随机输入权重通常导致的性能不稳定问题。本文将广义深度自编码拓展为双线性结构以进一步提高该网络结构的稳定性与特征提取能力,然后针对双线性结构产生的高维双线性特征采用非对称降维策略进行降维,最后利用集成学习中的加权投票法将降维后的双线性特征进行融合得到最终的肺结节分类诊断结果。实验表明,拓展为双线性后的广义深度自编码有更加鲁棒和有效的特征提取能力,并通过实验表明该方法用于肺结节诊断中的有效性。