【摘 要】
:
糖尿病视网膜病变(DR)是一种常见的、长期的并发症,如果不能得到正确的诊断和处理,会造成很大的视觉损害。由于该病症的多样性和复杂性,人工DR检测费时费力,具有很大的不确定性。针对上述问题,本文采取深度学习的方法,智能针对DR图像进行特征提取识别并分类,完成对DR的分级检测,增强诊断准确性,提高效率。本文的主要工作内容包括:首先选取开源的Kaggle数据集,针对数据集图像品质差异大,不同类型的样本量
论文部分内容阅读
糖尿病视网膜病变(DR)是一种常见的、长期的并发症,如果不能得到正确的诊断和处理,会造成很大的视觉损害。由于该病症的多样性和复杂性,人工DR检测费时费力,具有很大的不确定性。针对上述问题,本文采取深度学习的方法,智能针对DR图像进行特征提取识别并分类,完成对DR的分级检测,增强诊断准确性,提高效率。本文的主要工作内容包括:首先选取开源的Kaggle数据集,针对数据集图像品质差异大,不同类型的样本量不均衡等问题,对数据集进行标准化、归一化、Gamma调整、CLAHE直方图均衡化、以及数据增强等处理。获得图像质量符合要求,样本数据均衡的新数据集,为以后的模型训练作充足的铺垫。其次分别从卷积神经网络和Transformer模型两方面对数据集进行训练,并通过准确率、精准率、敏感度、特异度等评价标准对实验结果进行对比分析。卷积神经网络方面,采用AlexNet、MobileNet、ShuffuleNet网络模型及其变体进行对比实验并分析。以模型准确率降序排列为 MobileNetv3、ShuffuleNet、MobileNetv2、AlexNetvl、AlexNetv2,其中综合效果最优的MobileNetv3模型准确率达到了 87.54%。在Transformer模型方面,采用Vision Transormer模型和Swin Transformer模型分别对是否使用迁移学习进行了对比实验,并与卷积神经网络的实验结果进行了对比分析。得出最佳模型为使用迁移学习的Swin Transformer模型,准确率达到了 89.54%。该结果说明了 Transformer模型在糖尿病视网膜病变检测领域的识别效果优于卷积神经网络以及迁移学习对Transformer结构模型的重要性。另外,本文通过混淆矩阵对各网络的分类效果展开了可视化分析,发现本实验中模型对于类别0的样本分类效果最好,而对于类别1与类别2都出现了不同程度的错分。其原因是因为区别类别1和类别2的关键点“出血点”和“微动脉瘤”特征过于相似。导致模型不能很好地进行区分。最后采用最优模型Swin Transformer作为主体框架,使用TensorFlow Lite框架及Android Studio平台设计了一款糖尿病视网膜病变自动检测APP。该APP可实时进行诊断并得出结果,在一定程度上缓解了医疗资源紧张的问题。
其他文献
作为元宇宙发展的载体与业务形态,VR吸引了越来越多互联网企业的关注和投资,市场热度日益升高。裸眼VR短视频以其特有的传播优势,具有率先解锁VR市场的潜力。在短视频传播平台中,快手是唯一上架全景短视频的平台。对快手平台VR短视频传播效果分析表明,传播主体、传播内容、传播模式是影响传播的基本因素;进一步实现营销团队专业化、品牌定位精准化和流量发展私域化,是优化VR短视频传播效果的基本路径。
随着机械制造业的发展,运行设备的状态监测与故障诊断对于降低维护成本、减少损失、提高系统可靠性等都具有重要意义。轴承是机械设备中使用最为频繁的零件之一,因此准确有效的使用轴承故障识别方法有助于保障在线设备的安全和稳定。传统的方法往往需要依赖人工和专家,增加了故障识别的复杂度和滞后性,不利于实现在线设备智能化故障识别与检测。所以,为了实现对滚动轴承智能故障识别检测,本文研究了基于深度残差收缩网络的轴承
本文针对膏药贴的孔洞、泛黄污渍、黑色污渍进行了特征分析、检测算法设计、结果分析以及相应的算法改进。在孔洞检测中,单一的使用阈值分割法,如全局阈值分割法以及局部阈值分割法均具有局限性。本文提出了一种在方向灰度空间中基于局部灰度极值的检测算法。该算法结合了感兴趣区域提取和阈值分割两个部分,首先通过灰度分布曲线上的极值与幅值提取感兴趣区域,再使用阈值分割对感兴趣区域进行处理,达到检测孔洞的目的。其中,感
随着医疗影像采集技术的不断进步,眼底图像可以实现便捷、无创地获取。因此,观察视网膜血管的结构与形态也变得非常容易。在日常生活中,电子产品的激增很可能导致人们的用眼过度,大量的眼底图像有待诊断,这会占用大量的医疗人力资源。基于计算机视觉的视网膜血管分割对辅助临床排查以及诊断具有重要的意义。由于眼底图像存在质量较差、对比度不均匀、细血管区域特征不明显等问题,本文所研究的算法着重关注细血管区域分割的完整
管道运输由于其经济、高效、便捷的性质,已经作为能源的主要运输方式之一,广泛应用于石油、天然气的运输。长输油气管道敷设于复杂多变的地质环境中,不可避免的途径地震带、泥石流、冻土区域等不良地质环境。在不稳定的地质环境作用下,途径该区域的管道会产生局部位移,形成较大变形,附加应力,严重时会导致管道失效,引发重大安全事故。因此对长输油气管道的位移监测和应变测量具有重要意义。基于惯性导航技术的测绘方法,由于
眼睛是获取外界信息的重要器官之一,采用计算机视觉方法对人眼注视方向进行检测,能够令机器更好地观察和理解人类的行为活动。本文以在线学习为课题研究背景,研究基于眼特征的注意力检测方法,将视线估计方法与头部姿态估计方法相结合,实现人脸图像中被测者注意力状态的自动识别。针对基于人脸图像的头部姿态估计问题,采用基于EPnP的头部姿态估计方法,该方法首先在人脸图像中识别出二维人脸关键点,然后采用EPnP方法获
二维电荷耦合就是垂直和水平两个方向耗尽层所分别产生的横向、纵向二维电场效应。将其引入功率半导体器件中,能够实现高耐压与低导通电阻并存,突破“硅极限”。二维电荷耦合效应常以超级结的形式应用于单极型功率半导体器件中,如功率MOSFET和JBS二极管。本文主要针对二维电荷耦合器件(超级结功率器件)的高耐压原理、超级结JBS二极管特性、超级结MOSFET特性进行了研究,并提出优化方法,具体研究内容如下:首