【摘 要】
:
随着深度学习的快速发展,卷积神经网络越来越广泛的应用到计算机视觉领域中。我们通过多步卷积、池化等操作可以实现对特征图的下采样操作,以扩大感受野并提高神经网络的提取能力。然而,在多数的计算机视觉任务里,如在目标检测、语义分割、超分辨率等领域中,对特征图进行上采样操作以保留图像的整体细节也很重要。在传统的上采样操作中,通常在原图像像素间采用插值算法填入新的像素信息。这会出现生成图像目标边缘信息误差较大
论文部分内容阅读
随着深度学习的快速发展,卷积神经网络越来越广泛的应用到计算机视觉领域中。我们通过多步卷积、池化等操作可以实现对特征图的下采样操作,以扩大感受野并提高神经网络的提取能力。然而,在多数的计算机视觉任务里,如在目标检测、语义分割、超分辨率等领域中,对特征图进行上采样操作以保留图像的整体细节也很重要。在传统的上采样操作中,通常在原图像像素间采用插值算法填入新的像素信息。这会出现生成图像目标边缘信息误差较大,伪影和锯齿效应明显等问题。在深度学习领域,也提出转置卷积操作来处理上采样问题,但是相较于普通卷积,转置卷积因为需要占用较多的参数量,所以在实际问题中没有广泛应用。本文将传统方法中无参数插值算法与深度学习中的算法相结合,通过在算法中引入可学习的参数来改善传统插值算法的缺陷。新的算法在保证原有图像的特征情况下,通过计算特征图通道间与像素间的相关性,以保证在上采样期间正确还原图像的特征。我们将上述算法设计为通用的网络模型。在本文中主要的工作有以下两点:一、提出了一种新的上采样操作模型FBU(Feature Blend Up-sampling),采用将像素重排列的方法,得到符合上采样尺寸的特征图,使用混合计算像素间与通道间的相关性,通过反向传播使模型学到合适的参数以保证特征提取。在目标检测领域,此模型替换原有上采样操作后在应用场景最丰富的VOC数据集中,m AP均值提升了1.1%,小目标物体的检测效果提升了2.1%。二、本文将新提出的模型与注意力机制相结合,针对语义分割任务做出特定的改进,称为CAFBU(Channel Attention Feature Blend Upsampling)。通过对编码器特征图的通道域进行压缩和激励,找到通道之间的相互依赖性,这种网络设计不仅获取到深层特征图的语义信息和对应的位置信息,还能得到浅层网络中通道域的相关性信息,对重要特征施加关注。相较于原始的双线性插值算法,CAFBU经过2w次迭代m Io U提高了1.06%,并且CAFBU模型的参数量增加不足1%。
其他文献
如何构造3-李代数与3-pre-李代数是n-李代数研究中的重要问题.本文利用3-李代数Aw上权为1的齐性Rota-B axter算子,Ri(1 ≤i ≤34)与权为0的齐性Rota-B axter算子Si(1 ≤i ≤4),分别构造了 7类两两不同构的无限维3-李代数Ci(1≤i≤7),与3类两两不同构的无限维3-pre-李代数Di(1≤i≤ 3).并对所得到的3-李代数与3-pre-李代数的结构
信息粒化是一种将复杂问题简单化,将抽象问题具体化的思维方法.形式概念分析、三支决策、粒计算是当今知识发现与信息提取领域中的三个重要的信息粒化方法.在工程施工的质量评判中有十分重要的两大类,一类对工程复合材料质量评判;另一类对天然岩体质量评判.由于水泥混凝土是当代最主要的工程复合材料之一,地下工程岩体是当代桥梁、隧道等地下工程中重点研究的天然岩体之一,所以两者在现代建筑当中都扮演着十分重要的角色.而
传统的支持向量机(support vector machine,SVM)在分类问题中取得了较优的性能,得到了工业界和学术界的关注,研究者们陆续提出了SVM的多种变体。作为SVM的改进模型,最小二乘孪生支持向量机(least squares twin support vector machine,LSTSVM)比SVM的训练速度更快,分类准确率更高。除了上述用于解决两类分类问题的模型,单类支持向量机
本文研究拟线性椭圆方程组解的正则性和退化椭圆方程的分布解的正则性.首先,考虑由N个方程组成的拟线性椭圆方程组这里 α ∈ {1,...,N}是方程指数,N≥ 2,Ω(?)Rn,n≥ 2 为有界开集,u=(u1,...,uN):Ω→RN,f是可积函数.在所有系数的椭圆型,有界性和非对角系数“蝴蝶形支撑”的条件下,给出弱解的局部和全局的正则性结果.其次,考虑如下形式的退化椭圆方程的先验估计以及分布解的
机器学习是实现人工智能的一个途径,让计算机像人类一样具备自我学习能力,根据不同需求找出相应的信息。聚类是机器学习的一个研究方向,用无监督的方式寻找相似样本并归为一类。基于深度学习的联合训练带来聚类性能的突破,其预训练的结果对后续聚类任务有直接影响。一些聚类算法在不同数据集上使用不同的网络结构代表泛化能力较差,而且聚类性能相对于分类性能仍有很大的提升空间。因此本文对基于自监督特征表示的聚类算法展开研
由于在数理经济,模糊优化,过程控制和决策论等科学领域的应用,许多学者致力于将单值测度与积分理论的结果推广到集值环境中,得到集值测度与积分理论相关知识并应用于实际生产生活中.本文对集值非可加测度与积分理论进行研究.首先提出一种新的Banach空间上的集值非可加测度概念,本文称之为弱集值非可加测度,并讨论其性质,接着给出实值函数关于该种测度的积分概念并讨论它们的性质和结构特征.主要的研究内容如下:(1
近年来随着网络平台的发展,图像、视频等数据高速增长,多模态数据的研究与应用价值愈发凸显。这些多模态形式的数据蕴涵着人类丰富的意见与情感信息,具有高度的理论研究意义与实际应用价值。然而在多模态融合策略方面,目前多数融合方法关注于融合的阶段选择或融合的模型选择,缺少完整的多模态融合框架。在多模态表示学习方面,目前多模态表示学习的方法在模型输出时往往采用特征拼接或简单的融合方式,忽略了多模态特征有效融合
异常检测(Novelty Detection)被视为单类分类任务,其目标是检测出数据集中的异常数据。随着数据规模和维度的不断增加,传统的异常检测方法面临计算可扩展性差和“维度灾难”问题。为了解决该问题,传统异常检测方法通常需要大量的特征工程,相比之下,基于深度学习的方法能够自动学习数据中的潜在特征,从而有效解决计算可扩展性差和“维度灾难”问题,有效提高检测性能。因此,基于深度学习的方法在异常检测领
属性约简是粗糙集理论中的研究热点。现有连续值数据属性约简模型的建立主要基于优势粗糙集、邻域粗糙集、模糊粗糙集理论与方法。然而连续值数据属性间不一定具有优势关系;基于邻域关系的约简算法由于属性量纲不同导致邻域半径难以统一,除此之外样本间模糊关系及邻域关系的计算代价一般来说也是较高的。为解决上述问题,本文将聚类粒化方式应用于属性约简过程中,对现有连续值数据属性约简方法进行了改进。提出了基于聚类粒化方式
长尾分布数据分类问题是目前深度学习领域研究的热门方向之一,在计算机视觉领域中被称为长尾识别。长尾分布数据的头部少数类占据了大多数数据,而尾部多数类却占据了很少的一部分数据,当深度学习模型在处理这种长尾分布数据时会偏向头部类,产生很严重的长尾效应。因此,如何解决这种长尾效应是一项很有意义的研究工作。本文的主要工作包括如下两方面:(1)提出了一种基于双向聚类的长尾分布数据分类方法,该方法首先对头部类数