论文部分内容阅读
据国际数据公司IDC权威发布,到2025年全球人工智能应用市场总值将会达到1270亿美元。其中,医疗行业将占到总应用市场规模的1/5。2017年,我国国务院正式印发《新一代人工智能发展规划》,指出在涉及民生需求的医疗方面,应建立快速精准的智能医疗体系。在医疗领域中,人工智能辅助诊断主要是基于医疗图像展开研究。人工分析医疗图像误诊率高、易劳累,而基于深度学习的人工智能可大批量处理医疗图像、减少医生阅片时间,可无疲劳、不间断地工作,已被证明可以大幅提升医疗诊断的速度及疾病判别的准确率。但深度学习模型一般依赖大量的训练数据,可用的、高质量的、标注好的医疗图像数据不足,而且医疗图像存在不均衡性,有疾病的医疗图像更是匮乏,导致辅助医疗诊断模型的泛化性能无法被保证,制约了医疗智能化的发展。造成可用医疗图像不足的主要原因在于需要保护病人隐私,专业医生临床、科研任务重,无充足时间完成标注工作。基于生成式对抗网络的医疗图像翻译是人工合成所需医疗图像的重要手段,可以有效地提供高质量合成图像,对缓解医疗图像数据饥饿、提高医疗辅助诊断速率及准确率有非常重要的意义,成为当前医疗图像生成领域的研究热点。经查阅大量相关文献,分析总结发现基于生成式对抗网络的图像翻译方法仍然存在对已有数据利用不充分,关注性差、重点迁移生成能力不足以及生成图像质量不够好等问题,限制了合成图像在基于深度学习的医疗辅助诊断网络中的应用。针对上述问题,本文开展了基于生成式对抗网络的医疗图像翻译方法研究,进一步地验证基于合成图像数据扩充对医疗辅助诊断的有效性。主要创新工作如下:1)提出了一种基于重点迁移分支的医疗图像多域翻译方法。解决医疗图像翻译模型对已有数据利用不充分,关注性差、重点迁移生成能力不足的问题。在实际分析医疗图像数据不均衡现状后,选取重点目标域图像、建立重点迁移分支,充分利用已有图像数据与类别等监督信息,使用单生成器完成多域医疗图像之间的转换,保证医疗图像多域翻译模型的关注性能与合成图像的质量。最终,在胸部X光图像数据集上,完成了肺部无疾病正常图像、病毒性肺炎以及细菌性肺炎图像的相互转换生成,合成图像GAN-test和GAN-train指标分别达到92.188%和85.069%,在真实性和多样性上较其他生成模型有不小幅度的提高。2)提出了一种基于双重特征约束的多域医疗图像翻译方法。解决医疗图像多域翻译模型生成图像质量不够好,合成图像过于平滑、缺乏细节特征的问题。在保证网络重点迁移与关注性能的前提下,由判别器提取中间层特征,利用重构图像-源域图像特征一致性和生成图像-目标域图像特征一致性来双重约束图像转换过程,以保证合成图像的真实性和多样性。在胸部X光图像数据集上进行验证并取得了不错的效果,正常无疾病图像与两类肺炎图像相互转换生成,合成图像GAN-test指标提高至94.792%,GAN-train指标为85.069%,合成图像背景平滑问题明显改善,细节特征丰富。3)搭建了 一种基于合成图像数据扩充的肺炎辅助诊断模型。合成的胸部X光医疗图像与原始真实医疗图像共同作为训练集,研究辅助诊断模型在细菌性肺炎和病毒性肺炎图像分类中的性能。模型的肺炎诊断准确率达93.8%,相对于仅使用原始图像训练的诊断模型提高了 3.1%;疾病诊断的敏感性为96.69%,相对提高了 7.1%,特异性为89.20%;ROC曲线下面积(AUC)由94.00%提高到96.25%。实验结果良好地验证了由医疗图像翻译模型合成的医疗图像扩充训练数据对人工智能辅助诊断的有效性,为医生下一步给出肺炎针对性诊断措施提供辅助。