【摘 要】
:
实例分割任务主要是将图像中的几种类别区分并检测标记出来。在基础卷积神经网络的基础上,对模型进行改进。当前的实例分割算法无法分割两个高度重叠的对象,之前的实例分割算法基本都是对图片的目标进行检测,然后在生成的检测框的基础上进行实例分割,这样可能会导致两个非常近的人无法区分出来。本文发现利用人体骨骼的特殊性能够更好的把图片中的人精准的分割出来,从而避免了候选框所带来的漏检情况,并且本文提出了两种全新的
论文部分内容阅读
实例分割任务主要是将图像中的几种类别区分并检测标记出来。在基础卷积神经网络的基础上,对模型进行改进。当前的实例分割算法无法分割两个高度重叠的对象,之前的实例分割算法基本都是对图片的目标进行检测,然后在生成的检测框的基础上进行实例分割,这样可能会导致两个非常近的人无法区分出来。本文发现利用人体骨骼的特殊性能够更好的把图片中的人精准的分割出来,从而避免了候选框所带来的漏检情况,并且本文提出了两种全新的网络结构,极大提高了对人体实例分割的准确性。本文核心的思路有以下两点:1.提出了一个全新的评分机制的网络框架,利用人体姿态和评分机制的人体实例分割网络来提高分割质量。增加一个全新的评分机制模块,利用预测Mask与ground truth之间的Io U关系来比较准确的描述人体分割质量,并且提出了一种可以直接使用和学习Io U的网络,能够提高实例分割的质量。2.提出了一个全新的网络结构,利用人体姿态和实例位置相结合的卷积神经网络来改善网络结构。网络模型的核心是将人体分割再次解释成两个实例对象同时来完成的类别感知的预测任务。因此,本文决定把进行实验的数据对象平均分成一个规则的网格,被定义为S×S。假设进行人体分割的对象中心位置处在定义的网格中,那么这个网格不仅要完成对实例种类的预测,还要将对对象进行实例分割。总之,提出的网络框架对人体分割的结果更加准确,具有更加优越的鲁棒性。总体来讲,所提出的方法,大量的实验进行了验证和其他算法进行了比较,可以看出所提出的人体实例分割的新网络模型具有较好的准确性,使分割的的精度也有所提升。为了获得更加丰富的特征信息,采用Res Net和特征金字塔网络(FPN)进行特征提取,融合多层特征的信息,使分割结果更加准确。实验结果表明,新提出的网络框架对人体分割的结果更加准确,具有更加优越的鲁棒性。
其他文献
聚类算法是数据挖掘的主要任务之一,其主要用于发现数据库中未知的对象类别。子空间聚类作为目前主流的聚类分析算法,被广泛运用于计算机视觉、人工智能、网络分析和模式识别等领域。目前关于子空间聚类算法的研究成果繁多,其中基于谱聚类的子空间聚类算法具有显著的聚类效果。在聚类分析的应用领域中,高维数据普遍存在,尤其是面向二维数据的(即一个样本为一个矩阵)算法研究十分匮乏。对于二维数据来说,现有的子空间聚类方法
随着计算机技术的发展,计算机视觉系统已广泛应用于众多的科学、工程以及军事等领域,然而,在雾、霾等恶劣的天气条件下,获取到的图像往往视觉质量不佳,这将对许多户外计算机视觉应用产生不利影响。因此,图像去雾变得至关重要,是目前计算机视觉领域广泛研究的一个重要内容。针对暗原色先验理论在去雾过程中存在的部分图像边缘模糊、纹理细节丢失、且图像噪声扩大的不足,本文提出了两种不同的图像去雾算法:(1)考虑到变分模
由于全球气候变暖导致干旱发生的频率增加,干旱目前已成为全世界关注的重点问题之一,对干旱进行监测,可以减少因干旱导致的灾害。因此选择一个合适的干旱指标精准监测山东省的干旱情况,进而提高对旱情的预报与监测水平,对山东省的发展有重要的意义。本研究以山东省为研究区,主要研究山东地区2001-2017年气象干旱以及农业干旱,以期为监测山东省长时间序列的干旱旱情提供参考。本文主要研究的内容有以下三点:(1)基
随着柔性制造系统和智能仓储系统的快速发展,自动导引车(Automated Guided Vehicle,AGV)的应用需求日益增长。AGV是一种装备有电磁学或光学等传感器的自动导航装置,能够装载货物沿规定的导航路径行驶。为了提高AGV作业效率,降低运输成本,本文针对仓储环境提出基于强化学习的AGV路径规划方法。针对单AGV路径规划,提出了一种强化学习-蚁群算法。针对蚁群算法在某些情况中的缺陷,将强
高光谱图像包含丰富的图像与光谱信息,是典型的高维数据。高光谱图像分类是特征提取与地物解译的重要内容。研究人员可以通过分类的结果了解农业、环境和区域的变化并采取相应的措施。Potts模型是半监督变分分类模型,为数据分类提供了通用的理论框架,可拓展解决高维数据分类问题。同时,该框架能够融合非局部方法、约束优化方法实现高精度高性能数据分类,进而提高对高光谱图像分类的准确度和计算效率。本文基于Potts理
人脸是人体非常重要的生物学特征,人脸检测、人脸分割等人脸处理技术目前已广泛应用于安全、通信、医疗等领域,具有深入研究的实际意义。人脸分割的目的是找到人脸的轮廓,从而将人脸与图像背景分离。人脸分割作为多种应用的基础算法,对精度有很高的要求。由于姿态、脸型、发型遮挡、拍摄角度等原因,图像中的人脸的轮廓有很大的几何差异,这些因素影响分割精度。目前依然存在人脸检测不准确造成的人脸分割不精确问题,以及难以精
问答系统是近年来自然语言处理、信息检索等领域研究的热点。相对于传统搜索引擎只能得到繁琐且模糊的信息,问答系统可以返回给用户更加精准的答案。知识图谱可以将碎片化的知识通过三元组的方式组织起来,建立数据间的联系,形成网络,更有利于信息的搜索、挖掘和分析,因此基于知识图谱的问答系统(Knowledge Based Question Answering,KBQA)成为越来越多人的研究对象。但是目前对于KB
随机共振的出现颠覆了人们对噪声的认知,通常噪声被认为是信息在传输过程中产生的无规则信息,这种无规则信息干扰我们对原始信息的提取和利用,噪声的存在严重影响了数据的质量。随机共振效应的提出,为噪声的处理提供了一种新思路。随机共振效应在神经元中普遍存在,但如今对神经元中随机共振的研究较少,本文将随机共振效应与神经元系统相结合,针对弱信号增强和低峰值信噪比图像复原问题,提出了基于随机共振的神经元模型,主要
文本检测任务旨在用相关算法从文档或场景图像中定位出所包含的文本区域,该任务可作为各类计算机视觉任务的前置模块。现有的基于深度学习的方法克服了凭借经验手工设计特征的弊端,具有更强的特征学习能力,进而在工业和学术界大范围落地,然而当前的方法受到通用目标检测和语义分割框架的限制,检测器中的主干网络与文本特征不匹配,特征金字塔路径冗长,相邻文本判别算法效率低,文本结构特征保留能力弱等问题仍限制检测器的性能
中国象棋作为休闲和益智的一款游戏,流传至今,在伴随科技进步的同时,基于识别的机器人技术得到了很大发展,人机象棋博弈的相关研究也热度增加。当前,人机象棋走棋多为空间移动,为提高人机设备场地适用性,平面移动条件下的人机象棋博弈不可或缺,本文通过研究人机象棋相关方面理论,实现了一种基于平面约束条件下的人机象棋智能控制系统。其控制过程主要通过以下四个方面实现。第一、人机象棋系统棋子定位与识别。由机器视觉获