论文部分内容阅读
截止至2017年,全球糖尿病患者已达4.25亿人次。随着糖尿病患者病程的延长,患糖尿病性视网膜病的风险就越高,且此病现今已成为糖尿病患者视力障碍甚至失明的主要原因。如糖尿病性黄斑水肿就是一种危及糖尿病患者视力的常见症状。此外,黄斑变性也是另一种常见的可致盲眼病。这些疾病的早期诊断与治疗,是防止视力恶化的关键。但如此大量的筛查和诊断工作必定需要相当数量的专业眼科医生,而在中国的一线城市甚至发达国家都存在着医生缺口问题,在农村等欠发展地区则更为严重。鉴于上述存在的问题,本文的主要贡献是深入研究前沿计算机视觉技术,并将其应用于医疗图像病变识别任务;构造一款可用于医疗图像自动筛选和诊断的智能识别系统;该系统可用于在线诊断,方便医生和患者使用。在视网膜病变识别任务中,主要使用两个开源的视网膜OCT图像数据集,数据标签均由专业眼科医师手动标注。其中,2014_BOE_Srinivasan包括3231张OCT图像,分类任务为AMD、DME和NORMAL三类;OCT2017包括84484张OCT图片,分类任务为CNV、DME、DRUSEN和NORMAL四类。基于这些数据集,本文训练了4种经优化的卷积神经网络,并分别对其识别效果进行比较与分析。其中,具有126层的Xception模型取得了最好的识别准确率,在2014_BOE_Srinivasan中,对AMD、DME和NORMAL的识别率均为100%;在OCT2017中,Xception模型的识别准确率、回召率、灵敏度和特异性分别为97.5%、97.5%,98.39%和98.20%,对CNV、DME、DRUSEN和NORMAL的识别率分别为98%、97.2%、95.6%和99.2%,优于目前已发表文献中最好的识别效果。基于高准确率的分类结果,本文结合开源的U-net模型,对分类结果为DME病症的图像进行病理分割,以提高模型诊断结果的可解释性。通过对比发现,本文的模型达到了与专业眼科医师相当水平的识别精度。此外,为了验证深度模型在医疗图像识别任务中的可靠性,本文运用迁移学习方法,把Xception模型迁移至小儿肺炎胸部X光图像识别任务。在识别两类任务中,模型最终达到了96.31%的准确率和95.94%的回召率;在细分三类识别任务中,模型达到了88.78%的准确率和86.87%的回召率。