基于深度学习的图像语义分割技术研究

来源 :电子科技大学 | 被引量 : 12次 | 上传用户:x1026221496
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习因为具有复杂非线性函数拟合的能力,所以在许多挑战性任务上成为最有效的方法之一。但是,一方面,其成就依赖于海量数据的支持。另一方面,深度学习应用于具体场景时还需要考虑具体数据的特点。图像语义分割作为基本的计算机视觉任务之一,由于其目标是对所有像素进行分类,所以对其它任务有极大的帮助。考虑以上因素,本文以基于深度学习的图像语义分割技术研究为课题,着重开展弱监督和带先验的语义分割工作。语义分割数据的标注需要耗费大量的精力,所以全监督学习方式很难快速适应日益增长的数据。本文针对这种问题,研究了利用图像类别标签完成语义分割的弱监督学习方法。首先,依靠全局池化联合分类与分割的网络通常会获取目标更具有判别性的特征区域,这使得分割结果存在丢失小目标、难以识别细节特征和语义关系错位等情况。为了解决这些难题,本文提出采用空间金字塔池化替代全局池化。空间金字塔池化本来就具有多尺度上下文融合以及局部整体相互联系或对比的能力,它集成于很多典型的卷积神经网络中。加之,本文的新颖之处在于对空间金字塔池化区域引入信号掩盖机制,鼓励更多次级判别性特征区域用于训练与识别。而且,本文的竞争性空间金字塔掩盖池化损失函数动态地选择金字塔等级进行优化,使得区域掩盖和模型训练的效率增加。本文的模型在PASCAL VOC 2012上取得62.8%的交并比,相对state-of-the-art提升约1%,领先于简单的全监督模型。同时深度学习仍然没有摆脱专一性过强的束缚,模型要迁移到实际场景是比较难的。比如医学图像处理中,图像数据先验的影响可能超越模型。本文以黑色素瘤分割为例说明了数据先验的重要性。针对黑色素瘤区域的中心整体性先验,本文设计的图像增强策略保持了先验特点。然后,以分辨率上采样的反卷积操作强调特征图的空间区域关联性,进而分割输出单连通区域。模型分割性能比规模更大的ResNet-38好很多,其交并比较之2017年黑色素瘤分割比赛最佳模型也领先1.5%。由于图像的结构信息并不明显,条件随机场处理不能有额外提升。总之,弱监督学习以及先验与模型的结合都是未来通用人工智能的热点研究方向,具有长远意义。本文通过丰富可靠的实验证明了空间金字塔掩盖池化和深度上采样卷积神经网络的有效性。
其他文献
枇杷,起源于我国南方,以其果实的营养丰富、果肉的白嫩细腻、皮薄多汁等优良特点受到人们广泛的喜爱。栽培枇杷的技术历史悠久,现如今,枇杷栽培普遍存在着品质不高,产量少的
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
那伽信仰是东南亚湄公河流域各国存在的一种独特的文化现象,是东南亚文化特色的重要体现。这种信仰代代相传,已融入该地区人民的生产生活中,成为该地区宝贵的文化财富。泰国
依据直线发动机发电机系统设计思路,自主搭建了一套直线发动机系统,并对其进行起动和怠速实验。结果表明,直线发动机可顺利点火起动,首循环即可着火;可在1 450r/min稳定怠速
利用ADμC812单片机的串行口通过RS232接口与PC机通信,构成多路分布式温湿监测系统,可对输入量进行全面及时准确的判断和测量,并进行数据显示、打印和报警。实验结果表明,该系统的硬件设计简单,成本低、功耗小、体积小、控温效果好,具有一定的实用价值。
我国目前大力推广政府与社会资本合作(PPP模式),在签订合作协议中,因为一方主体是政府(或授权机构),有些项目又涉及到特许经营权协议,在纠纷的解决途径中能否约定仲裁一直存
本文分析了现今作文教学存在的问题剖析,提出了创设情境,激发灵感,科学建立学生作文的初始档案,模仿写作感觉出真水平,充分重视作文讲评课的针对效应等提高大班额初中课堂作
在当下时代,人们习惯在各种社交媒体平台上综合利用文本、图片、视频等多种模态的信息来表达自己整体的情感或观点。而挖掘并分析其中的情感倾向性对于监控社交媒体、公共关
国企改革对于我国的未来发展来说是极为重要的。针对国企改革本文提出如下建议:积极重塑政企关系;推行混合所有制改革;逐步退出垄断领域;继续加强廉政建设。希望本文提出的观
素质教育作为一种新的教育思想,正在逐步被社会、政府和广大教育工作者所接受,赞成实施素质教育的人越来越多,特别是广大教育工作者在素质教育的理论指导下,进行了大胆的实践探索