论文部分内容阅读
近些年来,随着深度学习概念的引入和与之相关的各种计算平台的不断涌现,使得其在图像、语音和自然语言处理中得到广泛的应用,并呈现出它的独特强大优势,而且这种应用还在继续得到拓展和延伸。在医学图像处理分析领域,将深度学习技术应用于计算机辅助诊断检测系统也受到学者们广泛关注。在本文中我们借助深度卷积神经网络---一种深度监督学习下的机器模型,探讨它在眼底视网膜光学相干层析扫描图像中对老年性黄斑病变分级、分类的应用价值。黄斑处于人眼视网膜的光学中心,是视觉最敏锐的部位。老年性黄斑病变(Age-Related Macular Degeneration,AMD)通常是指与年龄呈高度正相关的视网膜黄斑区退行性疾病。老年性黄斑病变具有病变种类多样、早期症状不明显、晚期病变不可修复、发病率高的特性,已经成为老年人失明的主要眼疾之一。定期检查和早期筛查是防控或延缓该视力疾病恶化的关键。作为筛查黄斑病变的重要手段--眼底视网膜成像,由于釆用了光学相干层析扫描成像这种无接触无创伤分辨率高的成像技朮,使之成为检查眼底视网膜疾病的主要成像方式。然而,传统的老年性黄斑病变分类研究通常采用由人工标注特征的分类方法。这类方法的实现常常需要人工参与,繁琐且耗时。使用深度学习方法,可以自动学习图像特征,在输入和输出之间,建立非线型复杂模型。我们借助深度学习技术,实现了高效地老年性黄斑病变分类研究。论文的主要工作和贡献包括以下几个方面:一、针对黄斑病变种类多样、病变形状不规则、表征复杂等特性对准确分类带来的影响,提出了基于深度卷积神经网络Res Net50,结合焦点损失目标优化函数的视网膜黄斑病变分类模型(Advanced Residual Network,ARN)。该模型的设计思路是充分利用残差网络的丰富非线性结构从眼底视网膜光学相干层析扫描图像中自动有效地提取黄斑病灶的高维通用表征信息。通过焦点损失函数作为目标优化函数,解决本文数据集样本不均衡、难易样本训练困难的问题。实验结果表明我们所提出的ARN分类模型在老年性黄斑病变的分类性能上显著优于HOG-SVM和VGG16传统分类方法。二、针对在分类复杂黄斑病变图像时分类精度不够高,不能充分提取和利用图像特征和多尺度信息等问题,提出了以残差网络单元作为基础并引入注意力机制来构建残差注意力黄斑病变分类模型(Atten-Res Net)。该模型的设计思路是在充分利用深层网络提取高维黄斑病灶特征的基础上,通过混合注意力机制结合黄斑病变图像的空间注意力信息和信道注意力信息,实现对整幅图像的注意力加权,完成对病灶特征的选择,使得模型更多地关注有效分类特征,抑制无效特征,降低复杂组织对分类性能的影响。实验结果表明,引入注意力机制后,Atten-Res Net分类模型可以有效提高黄斑病变的分类准确率。