基于局部区域生长和Faster R-CNN的弱监督图像语义分割

来源 :安徽大学 | 被引量 : 0次 | 上传用户:guosuzhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展,人工智能已经步入我们的日常生活,如在自动驾驶,智能机器人,医学影像分析等领域被广泛应用。图像语义分割是人工智能领域的一个热点和难点,其目的是为图像中每一个像素分配一个标签。目前,由于缺少大规模的像素级标签数据集,限制了图像语义分割的进一步发展。因此,研究者将目光转向弱监督图像语义分割,用易获得的弱监督信息代替难获取的像素级标签去训练语义分割模型。其中,图像级标签在弱监督信息中最为简单,不仅标注耗时少,而且易获取大量的数据。近年来,基于图像级标签的弱监督图像语义分割方法蓬勃发展。然而,图像级标签提供的监督信息只有图像中是否存在某一目标,与精确的像素级标签有着很大的鸿沟,因此基于图像级标签的弱监督图像语义分割面临着很多的挑战:(1)图像级标签过于粗糙,缺少对目标的位置和边界信息描述,无法直接进行图像分割模型训练。(2)由于图像背景复杂,难以对目标进行充分的区分并分割,这是整个弱监督图像语义分割共同的难题。(3)当下基于深度学习的弱监督语义分割模型,过分关注目标的显著性区域,导致目标分割不完整。本文针对以上问题进行了的研究,具体贡献如下:(1)针对图像级标签缺少目标的具体位置信息,可以由Faster R-CNN目标检测器在图像级标签下生成目标物体框,但是Faster R-CNN提供的目标物体框比较模糊,难以完整的包含目标,因此本文提出一种优化物体框的方法。首先对图像进行超像素分割,对于不规则的超像素,利用双线性插值算法将超像素变形为统一大小,并提取方向梯度直方图(Histogram of oriented gradient,Hog)特征。接着建立区域邻接图,每一个顶点代表一个超像素,通过广度优先遍历算法(Breadth First Search,BFS)遍历邻接矩阵,随后结合Hog特征寻找物体框外属于目标的超像素,得到优化后的物体框。最后使用Grabcut算法对优化后的物体框内的目标进行分割。实验结果表明,该方法在PASCAL VOC 2012和MSRC-21数据集上的性能优于某些方法。(2)针对当下大多数基于深度学习的弱监督语义分割模型过分关注目标的显著性区域,导致语义分割结果不佳,我们给出了MDCDSRG(Multi-Dilated Convolutional Deep Seed Region Growing,MDCDSRG)方法。具体来说,针对DSRG(Deep Seed RegionGrowing,DSRG)算法提供的种子点稀疏且只关注目标的判别区域,我们在多标签的分类网络中间层加上不同扩张率的空洞卷积,可以获得多尺度的目标定位图,然后将这些目标定位图聚合成一张定位图,即种子点。该种子点包含目标的判别区域以及周围相关的区域,这些区域比同等的技术生成的种子点更大更密集,从而改善初始种子点总是小而稀疏的问题。最后将获得的种子点进行深度种子点生长以完成图像语义分割。实验结果表明,该方法在PASCAL VOC 2012数据集分割精度为62.7%,优于最近的同类方法。
其他文献
随着城市轨道交通蓬勃发展,地铁隧道的安全状态检测越来越重要。针对既有地铁隧道巡检技术无法获得隧道裂纹深度信息、难以区分表面裂纹与水渍痕迹等背景干扰的难题,本论文设计了一种基于机器人和结构光传感器的车载高精度裂纹识别技术,通过获取裂纹的三维信息,实现对地铁隧道裂纹的可靠检测。论文首先针对隧道表面缺陷深度信息的车载检测难题,基于既有地铁隧道检测车设计了一个三维信息采集与数据处理的硬件装置。在检测车已有
博物馆中“展览品人”伦理性的基本问题是:按照一定分类逻辑将“展览品人”陈列出来,构成一种思维上的价值导向和空间观念秩序的可视化表达。其价值导向和表达所遵循的伦理框
1937年世界经济大萧条之后,尤其是二战以来,多个国家将产业政策作为干预经济运行的重要手段。同样,从我国早期的计划经济到如今的市场经济,产业政策对我国经济的发展起到了重要的指导性作用。由于国内劳动力等生产要素价格的攀升,中国中低端制造业渐渐丧失其成本优势,未来发展面临困境,需要进行转型升级。最近几年我国也在不断加大对产业转型升级的政策支持,如《中国制造2025》和《智能制造发展规划(2016-20
自互联网的诞生以来,社会信息化程度的逐渐加深,一方面使得人民生活更加便捷,另一方面,近些年网络安全事件频发,网络安全逐渐得到人们的高度重视。经研究发现,在钓鱼网站、远控木马等网络攻击中常使用大量的非常规域名,为了及时应对这种情况,本文将根据现有的非常规网络域名的文本特点和DNS查询表现特征研究出一套非常规域名检测方法,打击其对网络环境的危害,维护网络安全。面对海量域名,已有的非常规域名检测方法各有
随着经济社会的发展以及互联网的普及我国农村居民的生活水平及精神面貌发生了巨大的变化,农村居民的收入水平在稳步提升,消费观念在悄然转变,生活质量也在提高,居民对畜产品的消费从吃得起到吃得饱、吃得健康营养转变。方山县农村居民也不例外,但是与发达地区以及畜牧业发展水平较高地区的农村居民相比,方山县农村居民对畜产品的消费水平还比较低。方山县农村居民畜产品的消费对方山县畜牧业的发展、全县经济发展甚至我国20
自从拓扑材料的发现以来,人们对量子体系的拓扑性质的研究就有着极大的兴趣。对于零温时体系基态的拓扑性质已经有了深刻而系统的研究,如拓扑超导体、拓扑绝缘体,反常量子霍
如同Killing型一样,一个深刻的定义对于理解李代数理论大有裨益。导子本身也是李代数中的一个重要概念,在李代数的结构理论中地位举足轻重。双导子是导子的一种推广,通过计算
党的第十九次代表大会提出了实施乡村振兴战略的重大决策部署,2018年“中央一号文件”指出农业农村农民问题是关系国计民生的根本性问题,再次提出“要以实施乡村振兴战略为总
研究背景及目的:既往研究显示,血管平滑肌细胞(Vascular smooth muscle cell,VSMC)由中膜迁移至内膜并异常增殖与血管再狭窄及所致相关疾病的发生、发展关系密切。相关临床及
芳烃苄位仲C-H键(乙苯及其衍生物苄位C-H键)的催化氧化是化学工业中一个重要的转化过程,其氧化产物如芳香酮,是一系列重要的精细化工产品和基础化工原料,广泛应用于香料、香精