基于区域与深度残差网络的图像语义分割

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:sst3562008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉技术是利用计算机代替人眼对图像或者视频中的目标进行识别、检测和跟踪等,然后对其进行下一步的处理。随着深度学习的高速发展,以深度学习技术为基础的计算机视觉也渐渐出现在日常生活中的各个领域。图像语义分割是计算机视觉领域的一个分支,越来越多新兴的应用领域需要精确和高效的分割机制,如自动驾驶、地理信息系统和医疗影像分析等。如何得到精确高效的分割结果,是当前语义分割领域迫切需要解决的问题。基于区域的语义分割方法使用多尺度提取相互重叠的区域,可识别多种尺度的目标并得到精细的物体分割边界,但是这种方法流程较复杂。基于全卷积网络的方法使用卷积神经网络自主学习特征,可以针对逐像素分类任务进行端到端训练,但是这种方法通常会产生粗糙的分割边界。针对当前一些语义分割算法流程复杂、分割结果粗糙的问题,本文提出了一种结合区域和深度残差网络端到端的语义分割模型。首先使用候选区域生成算法在图像中生成候选区域集。候选区域由边界框(bounding box),前景掩膜(mask),前景大小(size)三部分进行描述,并进行存储备用。然后将图像通过带扩张卷积的深度残差网络进行特征提取得到特征图。深度残差网络最先用在图像分类任务中,取得了很好的效果,但该网络最终的输出特征图分辨率低。为了适应图像语义分割任务,提出使用扩张卷积核来代替原残差网络模型中的普通卷积核,使网络最终输出高分辨率的特征图,便于后一步分割和分类操作。结合候选区域以及特征图得到区域特征,并将其映射到区域中每个像素上。为了更加突显目标前景,提出融合区域特征与区域前景特征两种特征。最后使用全局平均池化层进行逐像素分类。全局平均池化分类层可以接收任意尺度的输入,并进行逐像素分类。本文还使用了多模型融合的方法,在相同的网络模型中设置不同的输入进行训练得到多个模型,然后在分类层进行特征融合,融合方式包括均值法、投票表决法,得到最终的分割结果。在SIFT FLOW和PASCAL Context数据集上,本文提出的算法与现有的方法相比具有更高的平均准确率。通过定性对比实验结果可以看出,本文算法在目标边界处分割准确,分割边缘接近于真实标注结果,并且在一些小尺寸的目标上也有不错的识别效果。
其他文献
如今我们已经进入到一个信息技术融合的时代,网络技术的蓬勃发展使得传统媒介环境发生了翻天覆地的变化,传统媒体传的运作方式已经明显落后于时代发展的需求,新旧媒介的融合
文章从语言学的角度着手,首先阐述了翻译的本质,然后分别从符号学、文化语言学两方面,辅以古诗英译实例,讨论了古诗英译的难度与要求,最后提出了取得古诗英译工作成功的方法
城市动物园是我国野生动植物迁地保护的最重要基地之一,也是野生动植物科学研究和科普宣传教育的重要阵地。野生动植物迁地保护研究,是动物园最重要的职能之一,在做好野生动
当前网络视频传播中存在诸多伦理失范现象,亟待构建网络视频传播的伦理规范。本文结合案例分析了伦理失范的几种主要表现,包括虚假视频影像、侵犯隐私、传播不适当影像、未成
目的:观察中西医结合治疗慢性盆腔炎的疗效。方法:将168例慢性盆腔炎患者分成两组。对照组100例采用中西医结合治疗,86例采用纯西药治疗。结果:总有效率治疗组为96、0%,对照组为88.8
通过查阅文献资料,结合实地调查数据,阐述了广西三江县稻田养鱼产业发展的现状以及存在的生产缺乏标准,产品质量参差不齐;产品结构单一,品牌效应不足;群众缺乏引导,产业化程
本文研究了复值函数的分析性质,给出复值函数的极限与有界性定义。提出了复值函数连续、左连续、右连续、区间连续的概念。给出了复值复合函数的概念。
为增强公司员工的凝聚力,活跃员工文化生活,5月28日,一场温馨、快乐、员工及家人共同参与的家庭“家”年华活动在洛浦秋风园举行,凯迈机电部分员工及家属近百人参加了活动。
考虑深部开采条件下水平地应力作用不能忽略,引入有效应力,推导得到新钻屑量公式,分析给出了有效应力与钻屑量间关系,提出了通过有效应力判断钻屑量方法。在此基础上以典型阜
做语文教师十几年来,我已经习惯于站在讲台前,把教案设计好的相关内容,毫无保留地呈现给学生。课堂上,学生静静地听,认真地记,有规律地说,在良好的课堂秩序中,我日复一日地练习着自己
期刊