基于3D多分辨注意力胶囊网络的肺结节多种病理类型辅助诊断方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:wondercn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
明确肺结节的良恶性病理类型,对制定精准有效的诊疗方案至关重要。基于深度学习的辅助诊断方法可以减少对医生个体经验和工作状态的依赖,提升诊断效率。然而,现有的公开数据集中鲜有经病理学确认的肺部CT影像数据,无法保证样本标注的准确性和可信度。为更好满足临床需求,依据本课题组从合作医院、研究所采集的经金标准确认的肺部CT影像数据,开展了基于3D多分辨注意力胶囊网络的肺结节良恶性多种病理类型辅助诊断方法研究。
  根据肺结节良恶性多种病理类型辅助诊断方法的需要和深度学习方法性能的分析,选择较卷积神经网络更具优势的胶囊网络作为构建辅助诊断模型的基础架构,分别从网络结构和动态路由算法两个方面对经典的胶囊网络模型进行了改进。在网络结构的改进设计中,为了充分提取、学习肺结节在三维空间中的形态特征和层级信息,同时适应CT影像数据的维度,在2D胶囊网络结构的基础上,设计了三种3D输入情形下的3D胶囊网络结构。在动态路由算法的改进设计中,针对原始动态路由算法中的对数先验概率更新规则不能对更新增量的幅度进行限制,容易导致向量神经元长期陷入失活状态的问题,提出了一种以预测向量和迭代输出的向量神经元之间的余弦相似度作为对数先验概率的更新增量,来保证更新幅度受限的解决方案。通过对训练过程中的参数变化进行可视化跟踪,验证了原始动态路由算法引发的大量向量神经元失活的现象,以及改进动态路由算法的有效性。与AlexNet、ResNet-18、ResNet-50等经典深度学习模型以及结合影像特征和血清生物标志物的多模态融合模型的对比,验证了采用改进动态路由算法构建的3D胶囊网络(3D Capsule Network with Improved Dynamic Routing Algorithm,3D CapsNet-IDRA)辅助诊断模型的有效性。
  在构建的3D胶囊网络辅助诊断模型的基础上,针对所采用的多分辨方法引入的插值扰动对多输入、单输入辅助诊断模型分类性能的影响问题,提出了分别用于抑制和强化扰动信息的跨路径多分辨注意力机制。这两种类型的机制是以真实分辨率输入所在路径的特征图为基准,衡量其他路径对应位置上的特征图与其的偏差,然后用于特征图中各元素在空间范围内软性注意力分布的计算,再以叠加倍增系数的形式施加影响。如此,在3DCapsNets-IDRA的基础上嵌入多分辨注意力模块,构建了多输入的3D多分辨注意力胶囊网络(3D Multi-Resolution Attention Capsule Network, 3D MRA-CapsNet)。通过分别对3DMRA-CapsNets和3DCapsNets-IDRA的对比分析,展示了多分辨方法引入的插值扰动对多输入、单输入模型分类性能的不同影响。同样,与经典深度学习模型和多模态融合模型的对比,进一步验证了基于3DMRA-CapsNet的辅助诊断模型的良好性能,且其性能更优于3DCapsNet-IDRA。
其他文献
近年来,语音识别深入应用到各种不同的场景,抗噪能力也成为语音识别系统评价指标之一。语音识别系统主要包括声学模型和语言模型两部分,声学模型主要基于DNN-HMM搭建,提取MFCC特征系数作为声学模型的输入,语言模型则使用LSTM网络进行搭建。本文所搭建的强噪声环境下的语音识别系统中,声学模型基于DRSN-HMM搭建而成,得益于DRSN的独特结构,DRSN-HMM具有良好的去噪性能;语言模型基于LST
学位
在深度学习方法快速发展以及海量视觉数据可利用的背景下,计算机视觉领域近年来发展出多种视觉理解方法,旨在辅助机器理解和分析视频及图像的语义信息。图像翻译作为视觉理解的一种常见方法,其关键在于学习到一个可在图像域之间进行变换的映射关系,利用神经网络学习源域内容,然后将其转换到目标图像域空间。人类生产生活中的很多问题都可以转化为图像翻译的子任务,例如在自动驾驶领域,将车载摄像头拍摄的街景图转换为目标分割
学位
人工智能技术的不断发展为智慧监狱的建设提供了很多帮助,给实时监控要求很高的监狱监管部门提供了许多便利。相比于传统的视频监控推荐方案,基于深度学习的智能推荐技术能够在降低监狱管理人员监控视频观看强度的同时为观看人员提供更加合适的监控视频,从而在一定程度上减轻监狱管理人员的工作负担,提高监狱对服刑人员活动监管的效率。目前推荐系统技术主要应用在电子商务领域,技术方案几乎都是根据用户的身份标识和推荐对象的
学位
由于可见光通信(Visible Light Communication,VLC)技术具有频谱资源充裕、功耗低、安全保密性好等优点,近几年来已逐渐发展成为光无线通信领域科研工作者的研究热点。高速亮灭是发光二极管(Light Emitting Diode,LED)的特性,VLC利用其来传输信息,在短距离无线通信中成为射频通信的有力补充。由于商用LED调制带宽有限,导致速率较低,因而在VLC中广泛采用高
与传统的面部宏表情不同,微表情是无意识的、快速的面部表情,可以在测谎、刑事侦查等应用中提供重要的信息。然而,由于微表情的特殊性,微表情研究存在一些难题。在微表情数据库方面,由于微表情的采集工作较为困难、没有统一的数据库建立标准,因此,用于微表情研究的数据库较少,质量参差不齐。在微表情检测方面,传统的检测技术仅仅基于纹理特征或光流特征,检测的效果并不理想。在微表情识别方面,由于微表情数据库的匮乏,训
学位
随着移动互联网等领域的高速发展以及智能设备的普及,无线通信已成为服务人民生活、推动社会发展的重要支撑产业,无线通信5G基站作为国家“新基建”之一,关系到国计民生的方方面面。构建绿色高效的通信网络是无线通信领域的重要目标和热点研究方向,但通信业务需求的时空分布不均性为上述目标提出了巨大挑战,不能随通信需求变化进行及时调整的通信资源分配将会导致服务质量下降以及能源严重浪费。准确的无线流量预测可以直观反
随着互联网的普及以及第五代通信技术的蓬勃发展,基于超高清图像、视频的应用受到了越来越多的青睐。受拍摄设备或者拍摄环境等因素的限制,往往无法直接获取到超高分辨率的图像或视频,进而需要通过超分辨算法进行后期处理。同时,与低分辨率图像、视频相比,超高清图像、视频内容包含的数据量骤增,如何进一步提高其压缩效率也成为当下的迫切需求。  插值滤波方法在图像超分辨任务和视频压缩任务中均有关键作用。图像超分辨是对
随着科技迅速发展,无线通信和信息处理方面的理论应用研究得到了研究人员的广泛关注。面对一些复杂的优化问题,当传统方法不能得到较好的结果时,一些研究人员从自然界法则和生物系统中受到启发,设计出一些启发式智能计算方法——智能优化算法,其中群智能算法是一大类模拟生物种群行为的智能算法。狮子作为食物链顶端的动物,比较擅长合作捕猎,近年来模拟狮群行为的群智能算法得到了许多学者的研究。  狮群优化算法是一种模拟
随着信息技术的蓬勃发展和高效视频编码(High Efficiency Video Coding,HEVC)的普及,HEVC视频在人们生产和生活中的作用更为重要。然而,由于HEVC视频缺乏有效的版权保护措施,盗版视频流通猖獗,各种侵权问题和维权之争层出不穷。因此,针对HEVC视频的版权保护已迫在眉睫。鲁棒视频水印,是目前解决视频版权纠纷的一个重要技术手段。本文研究了两类鲁棒视频水印:原始视频水印和压
学位
计算机辅助诊断(Computer Aided Diagnosis,CAD)研究是一个快速增长的活跃领域,利用CAD技术对人体部位的CT影像进行处理,可以为医生提供实用的参考信息,辅助医生对疾病做出准确的诊断,有效减少漏诊、误诊的情况发生。本文开展基于CT影像肺结节良恶性多种病理类型的云端人工智能辅助诊断系统开发研究,旨在设计一套集CT显示、肺结节提取、肺结节分类诊断等功能的计算机辅助诊断系统,辅助