基于自注意力机制与编解码网络的图像语义分割

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:dolan525
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分割技术已经成为计算机视觉领域的研究热点。语义分割应用于多个领域,例如自动驾驶领域、医疗领域、新零售业领域等等。为保证图像分割技术能正确应用在相应领域,准确分割图片中每一类物体的区域至关重要。传统图像分割算法中分析人员使用自己手工设计的特征,然后构造分类器分类。但是手工提取特征耗时且复杂,所以本文采用基于深度学习的图像语义分割方法实现对图片特征自动提取,完成对图片中每类物体的正确分割。大量的文献阅读和实验验证发现多尺度捕获上下文信息是一种有效提升语义分割精度的方法,特别是空洞空间金字塔(ASPP)模块。不同大小的卷积核捕获图像特征的关注点不同,所以在融合多尺度信息时不能简单通过拼接实现,而应该在融合不同尺度时给予不同的权重。基于以上考虑,改进原有的ASPP结构,将欧式距离作为注意力机制引入ASPP结构,通过欧式距离算出不同特征图的重要程度。另外,在解码阶段通过将高低维特征图通道重组来弥补下采样过程丢失的细节信息。由此提出基于注意力机制与编解码网络,当选择基网络Res Net50时,在PASCAL VOC2012和Cityscapes两个数据集上分别取得73.45%、64.27%的m Io U。虽然多尺度捕获上下文信息能提高语义分割精度,但是这种多尺度特征融合本质上还是局部特征的融合。为了捕获远距离上下文信息,受DANet网络启发,提出纵横压缩注意力模块,计算量小且精度高于原DANet网络中的位置注意力模块。在解码阶段,先前的工作用全局平均池化作用于高层特征图产生一个权重向量用来指导低层特征细节的选择。不同的是,本文对高层特征图用不同比例大小的池化结构进行特征压缩提取权重向量,用此权重向量指导提取低层特征图的空间细节特征。由此提出基于自注意力特征融合网络,当选择基网络Res Net101时,在PASCAL VOC2012和Cityscapes两个数据集上分别取得76.42%、73.13%的m Io U。为了和上一方法进行比较,在Res Net50也进行了实验。结果显示在Cityscapes数据集上该方法提升了8.86%。
其他文献
学位
住房保障扶贫政策的实施是我国政府为了改善困难群众生活居住条件,提高困难群众收入,实现困难群众住有所居,居有所安的一项重要举措。2011年中央提出“两不愁、三保障”的概念。2020年全国脱贫攻坚任务圆满完成,在这个过程中,实现了扶贫对象不愁吃、不愁穿,保障其义务教育、基本医疗和住房的目标。特别是住房保障扶贫政策,住房安全得不到保障,不仅会威胁到困难群众的生命财产安全,还会因为居住在偏远的山区,影响他
学位
学位
学位
学位
学位
当GPS或者其他绝对定位方法不可用时,连续估计载体的准确位姿是相对较难的,同时定位与地图创建(Simultaneous Localization and Mapping,SLAM)是解决此问题的核心技术。视觉惯性导航系统(Visual Inertial Navigation System,VINS)可以达到较高精度,因此它是目前在领域中比较热门的研究方向,但当载体(如小车)在平面上做匀速或匀加速运
学位
当前,随着我国“放管服”改革的进一步推进,尤其像浙江省推出“最多跑一次”改革,种种迹象表明,我国正向服务型政府大踏步迈进。在此大背景下,公共部门的公务员作为国家公共产品和服务的直接提供者和实施者,其公共服务能力提升是当前最为迫切的任务。如果服务能力不足,可能引起服务对象不满,影响政府形象,进而影响各项方针政策的实施效果。因此公务员公共服务能力这一课题也被众多学者深入挖掘,以此来解决公务员公共服务能