【摘 要】
:
图像分割是图像分析与理解的基础,语义分割作为图像分割中的一项高层次任务,是计算机视觉领域中热门的研究内容。其研究成果被应用到自动驾驶、农业等领域,具有重要的学术及应用价值。随着深度学习的迅猛发展,很多基于深度学习的语义分割算法取得了一定成果,但没能充分利用图像的低级信息,对于目标边缘处的细节的分割精度有限。而超像素不但能较好地保留目标物体的边缘信息,还能代替大量的像素表达图片特征从而减少后续模型训
论文部分内容阅读
图像分割是图像分析与理解的基础,语义分割作为图像分割中的一项高层次任务,是计算机视觉领域中热门的研究内容。其研究成果被应用到自动驾驶、农业等领域,具有重要的学术及应用价值。随着深度学习的迅猛发展,很多基于深度学习的语义分割算法取得了一定成果,但没能充分利用图像的低级信息,对于目标边缘处的细节的分割精度有限。而超像素不但能较好地保留目标物体的边缘信息,还能代替大量的像素表达图片特征从而减少后续模型训练时的噪声干扰。本文针对目标边缘细节的分割问题,提出了结合超像素的语义分割算法,主要工作内容如下。为了提高超像素对边界的贴合度,提出多层级迭代的图像超像素分割方法。首先使用局部明暗信息增强图像的弱边缘,然后使用简单线性迭代聚类算法分割超像素,在其基础上进行多层级迭代细化分割结果,提高超像素对物体边缘的贴合度,改善对目标弱边缘的边界贴合性差的问题。对于较小区域的超像素,采用多层级合并改善过分割问题。实验结果表明在BSDS500数据集上,提出的方法对目标物体边缘的贴合度较好。在超像素块数大于200时,边界召回率、F-Score、欠分割错误率指标均优于对比算法。故使用该方法得到的超像素可以进一步提高结合超像素的语义分割方法的准确率。为了降低模型规模和复杂度,同时尽可能保证模型深度以及获取上下文语义信息和局部特征的能力。在语义分割阶段,使用轻量级特征提取网络对PSPNet网络模型进行优化,得到L-PSPNet模型。为了提高算法在边缘区域分割的准确度,提升模型感知图像低级信息的能力,提出两种结合超像素与L-PSPNet模型的语义分割方法。第一种方法使用超像素对语义分割结果进行后处理的方式。利用超像素语义标注准则,使用多层级迭代超像素分割方法得到的超像素结果,优化L-PSPNet网络得到的语义分割结果。实验结果表明,在PASCAL VOC数据集上与L-PSPNet模型得到的语义分割结果相比,经过修正后的目标轮廓更加完整,平均像素准确率指标提高了2.55%,总体平均交并比指标提高了2.2%。第二种将超像素图像作为模型输入,减少特征提取时不必要的像素级信息,然后采用跳层结构和空洞卷积对L-PSPNet网络模型进行优化,建立结合超像素的多层特征融合语义分割模型,即MSL-PSPNet模型。实验结果表明在PASCAL VOC数据集上与其他语义分割算法进行对比,得到结果在目标边缘处的分割精度更好,样本平均像素准确率指标最高达到88.1%,总体平均交并比指标最高达到77.5%,均优于其他对比模型。
其他文献
在计算机视觉中,图像分割(为图像中每一个像素进行类别标记的技术)是后续其他研究的基础,所以图像分割效果的好坏会对后续的研究产生影响。基于深度学习的图像语义分割算法面临的主要问题包括:分割场景的复杂性、分割对象的多样性、分割对象空间位置的随机性以及分割模型的精度与计算效率相互制约的矛盾等,本文针对这些问题开展基于深度学习编解码结构的图像语义分割算法研究。本文主要研究工作和贡献如下:(1)对特征提取编
随着永磁材料性能的不断发展,永磁同步直线电机(PMLSM)以其低损耗、高精度和高效率等优点被广泛应用于精密数控机床等直线进给系统。由于直驱系统中免除了传动环节,外界干扰和参数变化直接作用于电机动子,增加了系统的不确定性。因此,在不确定性扰动条件下研究快响应、高精度的控制策略十分重要。自抗扰控制(ADRC)的设计过程不依赖于被控对象的精确模型,具有强鲁棒性,在电机控制领域得到了广泛应用。但ADRC中
关键词广告中商标隐性使用行为成为经营者在互联网时代备受青睐的一种新型网络营销手段。经营者通过购买搜索引擎服务商提供的竞价排名付费搜索服务,仅将他人商标设置为搜索关键词,使得消费者在搜索这一商标关键词时,经营者自己的网页链接能够与商标权人的网页链接共同出现在搜索结果页面中,从而获得流量和注意力,增加交易机会。在行为的定性上,该行为究竟是构成商标侵权还是不正当竞争抑或是合法行为,学界一直是争执不断。同
截至2020年,我国蔬菜种植面积高达2130万公顷,年产量7.5亿吨,蔬菜已成为我国第一大农产品;而且我国的蔬菜种植种类繁多,有200余种,不同蔬菜对移栽株距要求不尽相同,甚至同种蔬菜在不同时节、不同地区的移栽株距也不同。为改善植苗机构对不同移栽株距的适应性问题,本文提出了一种变差速轮系式植苗机构,进行了相关理论的研究,优化软件和机构结构的设计,虚拟样机的仿真分析以及物理样机的加工装配与试验研究。
我国是全球最大的蚕茧、生丝生产国和出口国。生丝是根据其规格要求,由自动缫丝机将多根茧丝集聚而成,其中丝鞘在缫丝的茧丝集聚过程中起到减少纇节、增加抱合的作用,但是丝鞘是现有自动缫丝机中仅有的几个需要人工来完成的操作,操作工的熟练程度影响到丝鞘结构参数,使得丝鞘的统一性较差,由此对茧丝集聚效果带来影响。由于是手工操作,影响了自动缫丝机的自动化程度,制约了缫丝劳动生产率的提高。本文针对现有缫丝生产中人工
风能作为一种可再生的清洁能源,近年来得到各国大力地开发。随着风电技术的发展,风机容量增加的同时也使得其结构复杂性大幅增长,最终导致风力发电机组故障频发的问题。由于风力发电机组的运维费用昂贵,因此对风力发电机组进行故障诊断具有极高的研究价值。不同于解析模型方法,数据驱动的故障诊断方法不依赖于建立准确的物理模型,通过分析大量采集到的反映机械运行状态的数据即可出色地完成故障诊断任务。作为开启大数据时代的
长期以来,塑料地膜的使用对环境造成严重污染,因此,以纤维素基材料制备可降解的地膜,成为了地膜发展的一种重要方向。本文以机械法对竹材进行微纳化处理制备机械竹浆,并添加适量针叶木化学浆及各种化学助剂,制备了可降解农用地膜纸,并对其应用性能进行了研究,所得结果如下:首先,对竹材进行微纳化处理制备了40°SR机械竹浆,并研究地膜纸的纤维配比。竹材经高压蒸煮预处理,磨浆,所得机械竹浆长度主要分布在200-2
随着个性化、多元化、差异化消费观念的形成和市场竞争的加剧,服装行业的生产方式向小批量、多品种、短周期、高质量的模式转变,这对服装企业生产管理的信息化和数字化程度提出了更高的要求。目前服装产业对于目标款式的部件及工艺分析、工艺单的编制基本依赖于人工,无法快速分析与制作工艺单、适应行业新模式的转变。针对这个问题,本文运用模块化思想对服装生产工艺进行分析与拆解,基于深度学习技术对衬衫领部识别与工艺种类判
黄瓜花叶病毒(Cucumber mosaic virus,CMV)是一种重要的植物病原,它具有经济危害性高,覆盖面积广等特点。CMV致病性主要取决于CMV编码的2b蛋白。在田间分离的部分CMV株系会携带一种不编码任何蛋白的卫星RNA(satellite RNA,sat RNA),后者完全依赖CMV进行复制。Sat RNA的存在通常会对辅助病毒的致病性产生影响。大多数sat RNA能够明显减轻CMV
在计算机图形学和视觉领域中,场景深度图超分辨率重建十分重要而又充满挑战。利用深度相机拍摄采集的场景深度信息在诸如增强现实、体感游戏、三维重建、自动驾驶、机器人定位导航等均起到至关重要的作用,然而由于获取场景深度信息的深度传感器设备分辨率、感光器件质量等的局限性,拍摄采集得到的场景深度图像通常存在分辨率低、深度图模糊的缺陷。深度图像超分辨率技术能够将场景深度图像由低分辨率、低质量提升为高分辨率、高质