基于深度学习的新冠肺炎CT图像识别

来源 :中央财经大学 | 被引量 : 0次 | 上传用户:lovegyyf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新冠肺炎疫情自爆发以来迅速在全球蔓延,毒株的变异更是增强了新冠肺炎病毒的传播能力,欧美地区感染人数仍在飞速增加,中国部分地区也出现多轮疫情反复,新冠肺炎疫情仍然影响着人们的正常生活,威胁着人们的生命健康。在新冠肺炎将长期与人类共存和疫情防控常态化的背景下,迅速对具有流行病学史或发热等临床症状的病例进行筛查诊断,将有效阻止新冠肺炎在人群之中传播和扩散。胸部CT影像,作为新冠肺炎确诊的重要诊断依据之一,通过人工智能的手段提高其检查结果的准确性对提高新冠肺炎的临床诊断能力具有重要意义。因此,本文使用SARS-Co V-2 CT-scan数据集,通过三类不同的方法建立新冠肺炎CT图像分类模型,比较各方法各模型的分类效果和训练时长,旨在找到高效区分感染和未感染新冠肺炎CT图像的方法,提高新冠肺炎患者识别的精度和效率。此外,本文还通过Grad-CAM可视化方法和可解释的神经网络模型x DNN研究图像类别划分依据,探索图像分类的可解释性,从而在实际临床诊断中为医生提供更精准的诊断参考,提高深度学习模型在实际医学领域中的说服力和可靠程度。具体而言,本文针对新冠肺炎CT图像识别问题的三个研究内容如下:第一,使用卷积神经网络模型直接进行图像分类。本文分别拟合VGG16、VGG19、Inception V3、Res Net50、Dense Net121、Mobile Net V2和Xception七个卷积神经网络模型,选取各模型训练过程中分类效果最好的模型作为新冠肺炎CT图像分类模型。使用这些模型对训练集图像进行分类预测,结果发现:除VGG19外,各模型的预测准确率和召回率均在95%以上,卷积神经网络模型在新冠肺炎CT图像识别分类研究中具有有效性;七个卷积神经网络模型中,InceptionV3分类准确率和召回率均最高,且平均每个epoch的计算时间最短,模型分类性能最好。通过Grad-CAM方法绘制热力图,展示图片中各像素对卷积神经网络分类结果的贡献度,使分类依据得以可视化,在临床诊断中可用于突出病灶位置,解释诊断结果。第二,使用深度学习与机器学习相结合的方法。本文分别使用预训练和最优VGG16、Inception V3、Dense Net121提取特征向量,再输入岭回归、SVM、决策树、随机森林、XGBoost中拟合分类模型。对比各模型结果发现:与对应的卷积神经网络分类模型相比,机器学习分类器有效提高了CT图像分类的准确率和召回率,在新冠肺炎CT图像识别研究中更具优势;在五种机器学习分类器中,XGBoost模型对绝大部分特征向量的分类均有较好的预测效果和较短的运行时间,在此数据集上更具适用性;三个ImageNet预训练网络VGG16、Inception V3、Dense Net121中,VGG16特征提取效果最好,基于此网络提取的特征向量分类器普遍拥有较好的分类性能。第三,使用可解释的神经网络模型。本文分别使用基于ImageNet预训练和最优VGG16、Inception V3、Dense Net121网络提取出的特征向量拟合x DNN模型,并对测试集的患者胸部CT图像进行分类预测。研究结果显示:x DNN的分类性能明显优于预训练卷积神经网络,但在卷积神经网络模型本身分类效果很好的情况下,x DNN模型对CT图像的分类性能无明显提升作用;与机器学习分类器相比,x DNN对大部分特征向量的分类效果优于机器学习模型,且xDNN模型不需要进行网格搜索和超参数选择,极大地缩短了模型调参时间。此外,决策过程透明、分类过程可解释,使其在图像识别尤其是医学影像识别问题上具有独特优势。综合本文研究发现,基于最优Inception V3(1*256)特征向量的xDNN模型分类准确率最高,召回率也处于最高水平,在新冠肺炎CT图像识别问题上具有最好的识别效果,且x DNN模型能够找到与新样本最为相似的原型,为其类别划分提供解释依据,具有可解释性。故在计算资源充裕的条件下,本文将此x DNN模型作为新冠肺炎CT图像识别的首选模型。若计算资源紧张,则考虑使用Image Net预训练的VGG16模型提取特征并用x DNN进行分类预测,此模型在保证分类性能较好的同时,有效降低计算机硬件要求,减少模型拟合耗时。
其他文献
在统计学、社会学和心理学的相关研究中,问卷是经常使用的一种数据获取方式,同时,量表也是经常会出现在相关研究中的一种数据类型。作为能够衡量被试者的观点态度的量表,李克特量表经常在统计学、社会学和心理学相关研究中被使用。由于李克特量表主要衡量人的主观态度或情感,在实际使用时,所获取的数据往往因为各种原因存在缺失或误差,比如若设置的题目较为敏感,被试者可能不愿回答或在回答时故意选择其他选项。获取的李克特
学位
主观幸福度作为近年来多维社会指标体系中逐渐被关注的重要变量,其不仅可以用来对单个社会成员的生活体验情况进行整体评价,也能够用于评估群体的社会现象。本文将职业女性这个群体作为研究的对象,探究她们的主观幸福度影响因素,主要研究女性一生中重要的两个节点——婚姻与生育对其主观幸福度产生的影响以及作用路径。本文的研究主要基于中国家庭追踪调查(CFPS)2018年的数据,在文献综述的基础上,经过描述与探索分析
学位
论文以鄂尔多斯盆地东缘大宁-吉县地区山西组页岩为重点研究目标,将野外剖面踏勘及岩心观察作为基础,结合后续一系列的分析测试数据,在沉积构造的大环境背景之下,理清研究区沉积相及平面展布特征;建立页岩划分方案并描述各类岩相特征;明确各类岩相所对应的储层特征,结合国内外优质页岩评价方案,对本次划分的页岩岩相进行优劣评价,识别出有利页岩相,为未来勘探开发提供一定的理论基础。研究区地处晋西挠曲带南部,左邻伊陕
学位
断层对油气的封闭性是由断层垂向和侧向封闭性构成,忽略某一项,将导致对断层封闭性的误判。如何进行断层封闭性的综合评价,断层封闭性与油气成藏的关系是什么,断裂在多大程度上控制了油气成藏等问题,值得深入研究。本论文以西湖凹陷平湖构造带为例,开展断层封闭性及其控藏作用研究。西湖凹陷平湖构造带位于我国东海海域,是我国最大的断陷式凹陷之一,构造带内穿断古近系平湖组的张性正断层极其发育,平湖组下段发育优质的烃源
学位
断裂构造控制着油气的成藏,厘清断裂特征和形成机制对研究构造油气成藏具有重要意义。彬长地区位于鄂尔多斯盆地的西南部,处于盆地内部三个一级构造单元的衔接部位,属于盆缘构造活动强烈与盆内构造活动较弱的过渡区域,其内断裂发育。为了进一步明确研究区断裂特征及形成机制,在资料收集与文献调研的基础上,通过高精度三维地震解析,对研究区断裂的构造样式以及平面特征进行分析,以此精细刻画出研究区内断裂的几何学特征,恢复
学位
为了深入分析研究常见建筑保温材料的燃烧性能,对不同种类的保温材料进行了燃烧性能测试。结果表明,无机类保温材料在防火性能方面明显优于有机类保温材料,并且燃烧性能与其物理、化学特性密切相关,不同种类的保温材料在燃烧过程中产生的现象和有害物质含量等也都有所不同。因此,在建筑保温材料的选择和应用过程中,应当充分考虑其燃烧性能,以确保建筑物的安全和环保。
期刊
2020年既是中国全建成小康社会总体目标的实现之年,也是全打赢脱贫攻坚战的收官之年。消贫困、改善民生、逐步实现人民共同富裕,是社会主义的本质要求,也是我们党的重要使命。脱贫攻坚的伟大胜利,改善了贫困地区的物质生活条件,提了贫困家庭的生活质量,增强了群众的幸福感。中国即将进入“后扶贫”时代,在享受脱贫攻坚取得的胜利果实的同时,也要时刻警惕城市与乡村之经济差距过大,发展不平衡不充分等的存在。绝对贫困的
学位
钱家店砂岩型铀矿地处松辽盆地南部钱家店凹陷内,是我国东部地区发现的首个超大型砂岩型铀矿床。尽管目前对钱家店铀矿的构造背景、成矿特点及控矿因素等方面进行了众多的研究,但对于在东西向不足百公里的小范围矿床内为何能产生巨大矿量的地质事实,仍有许多疑惑和未解之谜。按照中亚水成铀矿理论,矿床规模主要与层间氧化带的规模即地下水氧化时间、还原剂的丰富程度、地下流体铀的沉淀速率即热的作用等因素有关。而钱家店铀矿空
学位
互联网的快速发展为电子商务提供了土壤,网上购物已然成为许多人日常生活中不可或缺的一部分,而一个好的购物体验离不开物流配送环节。单量即订单数量,关系着物流侧的工作强度以及计划安排,对于那些与电商紧密相连的物流企业来说,单量预测是非常重要的一环,企业可以预测单量为基础,制定一系列库存计划,进行人员、设备的调配,实现资源配置优化,降低运营成本。另外,精细且准确的单量预测,有助于企业实现快速高效的物流配送
学位
由于新冠肺炎疫情走势的不确定性,各国的经济复苏进程不一。在数字经济加速发展、产业链重塑和金融市场波动加剧的格局下,突如其来的新冠肺炎疫情增加了许多新的金融风险和挑战。在本世纪过去的二十年中,极端风险的发生与蔓延均对相关国家金融体系安全造成严重冲击。由于当前金融机构间普遍存在的关联性特征,聚集的金融风险可能产生溢出效应,即当某一金融机构遭遇风险情况时,随着自身风险在逐步积累,与其在资产、负债、合作等
学位