【摘 要】
:
语义分割的任务是通过卷积神经网络预测输入图像所有像素点的类别标签,或理解为在像素层面进行的图像分割。目前,语义分割在单纯提升精度的研究工作已近瓶颈,同时也暴露出基于全卷积与监督学习下的语义分割模型的研究难点:1、标注数据成本问题。语义分割需要海量的标注数据作为精准分割的基础;2、计算资源问题。深度的卷积网络带来巨量的资源消耗,对硬件的要求非常苛刻;3、精细分割问题。深度卷积网络的池化和下采样步骤必
论文部分内容阅读
语义分割的任务是通过卷积神经网络预测输入图像所有像素点的类别标签,或理解为在像素层面进行的图像分割。目前,语义分割在单纯提升精度的研究工作已近瓶颈,同时也暴露出基于全卷积与监督学习下的语义分割模型的研究难点:1、标注数据成本问题。语义分割需要海量的标注数据作为精准分割的基础;2、计算资源问题。深度的卷积网络带来巨量的资源消耗,对硬件的要求非常苛刻;3、精细分割问题。深度卷积网络的池化和下采样步骤必定造成分辨率的下降,最终造成在边缘和小目标上的分割失败;4、上下文信息的缺失。基于深度卷积的模型容易忽视对上下文信息关注,分割结果的空间信息很差,出现类别上的分割错误。分数阶微积分是对经典微积分的推广,在信号处理中具有区别于经典微积分的记忆性和非局部性,广泛应用于数字图像的增强、边缘检测、去噪、奇异性检测等研究方向。本文针对语义分割模型中存在的精细分割问题,结合对分数阶微分的边缘检测研究,提出一种优化语义分割输出边缘的方法。主要研究工作如下:1、对基于分数阶微分的边缘检测开展研究。利用距离矢量的方法改进了三种分数阶微分算子,替代了Canny算法的梯度计算,验证了分数阶微分在边缘检测中的灵活性和非局部性等优势。提出一种改进Crone算子,减少了分数阶微分算子对初始化条件的依赖性。提出一种局部梯度检测的自适应分数阶边缘检测方法,利用类似卷积的运算方式,滑动检测图像局部的梯度大小,通过构建的关系函数求得梯度相关的均值阶数,代入改进算法中完成对图像的边缘检测。2、对基于像素分类的图像语义分割模型开展研究。首先,基于解码方式构造一条边缘支路,利用底层特征中包含的边缘特征和多尺度信息指导高层的分割,通过特征融合的方式对边缘分割进行优化。然后,结合注意力机制,优化解码器中边缘特征的学习权重,进一步强化模型对边缘信息的感知能力。最后,通过引入边缘分割任务对损失函数进行优化。
其他文献
作为物联网技术中的重要组成部分,无线传感器网络技术已广泛运用于各领域。然而,传感器节点有限的电池容量制约了无线传感器网络的工作寿命。一旦传感器节点电池能量耗尽,会影响某区域的监控质量。因此,如何克服该约束并延长整个网络的寿命是一个研究的热点问题。当前,无线充电被视为延长网络寿命的一种有前途的解决方案。传统的无线充电技术是基于单路的充电范式。然而,这种一对一的充电范式存在扩展性不足和充电效率低下等问
来波方向估计(DOA)在电子侦察对抗、无线电频谱监测、移动通信、雷达、声呐等领域都扮演着非常重要的角色,是阵列信号处理方向中一个重要分支。在目前通信环境中,存在大阵列需求,在大阵列系统中,将会给传统来波方向估计算法带来巨大的挑战,面临着运算量大以及高精度取舍等问题。传统来波方向估计算法在实际环境的适应性较差,因为该类算法是基于数学表达式的一种算法,需要对环境做很多假设,当实际环境难以达到目标条件,
随着信息技术的高速发展,目标跟踪技术在军事和民用领域都展现出了不可取代的重要性。而在目标跟踪的过程中,无法避免地,处理程序会接收到错误的报告点信息或是误差较大的报告点信息,即杂波。这无疑会使处理程序得到错误的跟踪结果,造成虚警、漏警等常见问题。针对这些问题,相关领域的研究人员提出了一些有一定适用性的解决办法,但在复杂场景下,由于杂波种类繁多,计算机性能有限等各种问题,导致目前常用的杂波识别算法不能
随着汽车保有量快速增长,随之而来的交通问题也日趋严重。自动驾驶作为一个有前景的解决方案,在迫切的社会需求和高度发展的人工智能技术共同催化下快速成长。近年来,强化学习在不同的控制决策任务中表现优异,已有研究将强化学习算法用于汽车自动驾驶控制,通过智能体与环境交互,并根据环境的反馈进行驾驶策略的学习。柔性演员评论家(Soft Actor-Critic,SAC)算法作为新颖的强化学习算法,引入了最大熵的
李清照是我国宋代的著名词人,作为艺术史上的一个重要人物,李清照作为婉约派词人的代表身份是不容置疑的,而在李清照跌宕起伏的一生中,多种因素也导致了她的诗词具有了豪放的一面。绕过李清照所擅长的婉约词,来探究李清照在婉约风格背后的豪放。通过李清照本人生平与其文本的共同分析,探究李清照在豪放词背后所表现出的个人性格以及时代特征。
网络嵌入,又称为网络表示学习,目标是为网络中的节点学习低维的向量表示。学习到的向量表示可以用于各种网络分析任务,例如节点分类、链接预测、节点聚类、网络对齐等。近年来,随着大量网络数据的产生,网络嵌入受到了越来越多的关注。根据学习节点表示时利用的网络数量,网络嵌入可以大致分为两类:单一网络情境下的网络嵌入与多网络情境下的网络嵌入。尽管已经有许多研究人员分别针对单一网络情境下的网络嵌入以及多网络情境下
随着新兴信息技术的高速发展,数据存储的规模表现出前所未有的增长速度。大数据环境下的数据不仅仅表现出数据规模急剧膨胀,同时也呈现出数据质量低下、价值密度稀疏的鲜明特征。此外,数据随时间的推移产生得快,变化得快,折旧得也快,数据流已成为大数据环境中一种主流的数据存在形式。因此,对大数据的采集及分析应是一个不断优化、持续更新的增量优化过程。海量高维、动态低质的数据导致数据挖掘与知识发现算法所需要的计算代
人脸作为直接、可靠的生物特征,被广泛应用于信息安全、社会公共安全、虚拟现实和增强现实等领域。人脸特征点检测不仅是许多人脸分析任务中至关重要的预处理步骤,也是图形学和计算机视觉领域的一个基本问题。尽管过去十年中二维人脸图像特征点定位技术快速发展,但二维图像对光照等环境因素并不鲁棒,而三维人脸可以较好地弥补这些不足,因此三维人脸特征点定位吸引了越来越多的关注。现有三维人脸特征点定位方法主要基于脸部特征
脉冲神经网络模仿生物采用脉冲进行信息的传递与处理,是类脑计算的重要研究内容,相比于传统的人工神经网络,它具有更高的生物可解释性、更强大的计算能力和更低的能耗,能够更好地处理时空特征信息,并且,基于脉冲神经网络能够构建神经形态计算,突破现代计算机发展的瓶颈。然而,深度脉冲神经网络具有复杂的时空关系和脉冲不可微的特性,这些难点限制了反向传播在深度脉冲神经网络上的利用,导致其性能与传统人工神经网络仍有差
红外图像分辨率低和非均匀性噪声显著是红外图像复原研究中的重要问题。不同于传统算法设计,基于卷积神经网络的红外图像复原方法最大特点是提升复原能力并减少设计成本,使算法更智能化。然而,现有的基于卷积神经网络的单帧红外图像复原方法中,网络模型通常只具备单任务处理(去噪或超分辨率重建)能力,并且丰富的数据量需求以及大规模网络结构会给数据收集、模型训练和存储带来困难。针对这些问题和难点,本文重点开展以下研究