基于Mask R-CNN的实例分割算法研究

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:linlijun002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实例分割是一项新兴的计算机视觉任务,不仅需要将图像中的每个感兴趣目标进行像素级别的分割,还需要区分每个类别的不同个体,该任务在自动驾驶,智慧医疗,机器人操控等领域具有极高的应用价值。本文基于实例分割模型Mask R-CNN对实例分割模型进行深入研究,提出了用于实例分割的改进模型,主要内容如下:(1)为了解决Mask R-CNN分割结果边缘处精度不足的问题,提升实例分割的效果,提出了一种基于多特征融合的实例分割模型。该模型在Mask R-CNN的基础上引入了边缘检测和语义分割分支,分别生成偏重于边缘信息和空间位置信息的特征图。此外,在进行ROIAlign操作时,将感兴趣区域(ROI)同时映射到相应的金字塔层及其相邻层得到复数特征。最后融合以上多个特征图,生成信息更加丰富的新特征用于后续的检测和分割任务,改善了实例分割结果的边缘细节,提升了实例分割的精度。该模型与Mask R-CNN相比,在COCO数据集上的检测和分割平均精度分别提升了1.2%和1.0%。(2)为了进一步提升Mask R-CNN模型的特征提取能力,提出了一种基于多分辨率并行与注意力机制的实例分割模型。该模型使用多分辨率并行残差网络与注意力特征金字塔代替Mask R-CNN中的Resnet101+FPN网络提取图像特征。多分辨率残差网络在残差网络结构的每个下采样阶段增加一个分辨率与下采样前相同的并行分支,将各分支的特征输出作为特征金字塔的输入,使得各层特征深度保持一致,并通过信息交互模块充分利用各层尤其是较低层次的信息。注意力特征金字塔通过在特征金字塔各层增加注意力模块,使得各层能够自适应的强调各自重要位置(如高层特征图的大目标位置)的信息,抑制次要信息。该模型有效提升了实例分割的精度,与Mask R-CNN相比,在COCO数据集上的检测和分割平均精度分别提升了1.8%和1.1%。
其他文献
生物节律,是指生物的生命过程以约24 h的近日节律进行震荡循环。许多生物过程以内源时钟机制维持其自身的生理和行为过程以适应外界环境,这种内源的生物钟机制,实际上是生物
近年来,我国认识到海洋利益对国家的重要性,提出海洋强国战略和“一带一路”倡议,这些战略的推行依赖于制度的完善,而2018年1月“桑吉”轮事故暴露出我国管辖海域船舶污染应
近年来,基于机器视觉的胶囊缺陷检测与识别技术日渐成熟。国内外也陆续出现了相应的产品,逐步实现了机器检测替代人工检测,提高了生产效率。虽然国外的胶囊检测识别设备具有
本文采用的是流向狭缝周期性吹气的主动控制方式控制平板湍流边界层。通过对比不同长度的流向狭缝的控制效果,得到最佳控制长度。在具备一定工程可行性的前提下,本文采用自行
传染病是一类可以在动物与动物、人与人以及人与动物之间交叉传播的疾病。近年来随着气候等自然条件的失衡,社会经济的不均衡发展,人类生活范围的不断扩张以及全球一体化进程
国际航行船舶的压载水是导致外来物种入侵的最常见途径之一,当船舶从一个港口运送货物到另一个港口,并提取当地的水作为压舱物时,它们在不知不觉中运输着外来物种。一旦外来
乌伦布拉克铜矿产于新疆东准噶尔野马泉-琼河坝铜多金属成矿带中,是研究东准地区(斑岩型)铜矿成矿规律的典型矿床,但是该铜矿研究程度较低,缺乏成矿流体和成岩成矿时代精确定年
坡北基性-超基性岩体位于塔里木地块东北缘北山地区的西南部,受北东向的白地洼-淤泥河深断裂控制,出露面积约165Km~2,岩体地表出露部分由北东向的两个相连的岩盆组成,长轴方
在现代的应用工程中,计算机视觉、人工智能成为重要的研究内容,其中目标跟踪在自动驾驶、监控安全、人机交互、智能交通等问题解决上有着重要的应用价值。视频目标跟踪作为计
伴随高考改革,此时高中的课堂教学也迎来了新一轮的挑战。物理课堂的高效性一直以来都是教学发展追寻的最终目标,高效课堂成为贵州省越来越多学校推崇的教学模式,遵义市第二