【摘 要】
:
深度学习在计算机视觉领域的应用十分广泛。例如物体检测、识别、跟踪,场景理解等。这其中,图像语义分割一直占据着重要的地位。全卷积神经网络在处理图像语义分割问题上展现出了前所未有的优势。最常用的全卷积网络为编解码器结构,在编码过程中,原图像会被降采样,因此大量的空间信息被丢失,导致分割精度下降。此外,通常的算法模型都会采用较为庞大的神经网络结构,导致推理速度的下降。而如果单纯的使用轻量级网络作为编码器
论文部分内容阅读
深度学习在计算机视觉领域的应用十分广泛。例如物体检测、识别、跟踪,场景理解等。这其中,图像语义分割一直占据着重要的地位。全卷积神经网络在处理图像语义分割问题上展现出了前所未有的优势。最常用的全卷积网络为编解码器结构,在编码过程中,原图像会被降采样,因此大量的空间信息被丢失,导致分割精度下降。此外,通常的算法模型都会采用较为庞大的神经网络结构,导致推理速度的下降。而如果单纯的使用轻量级网络作为编码器,虽然速度有所提升,但网络的感受野会下降明显,带来分割精度的下降。为了解决上述的问题,本文提出了一个基于双路网络以及不同层级特征融合的实时语义分割算法模型,主要的创新点如下:(1)对现有轻量级网络加以改进,结合深度可分离卷积与空洞卷积两者的优点,有效增加了轻量网络的感受野和对多尺度特征提取的能力,提升了轻量网络编码器提取的特征的质量。(2)提出注意力机制模块,对编码器提取的特征进行筛选,提升图像特征的质量,同时对图像上下文信息进行多尺度提取,进一步提升了分割的精度。(3)提出一种高效的特征融合的方法,将图像的空间信息与图像的语义信息充分融合,解决高层特征中图像空间信息缺失的问题,两种特征相互补充,提升了算法的性能。本文提出的算法在两个语义分割数据集上进行验证,相比于同类型的实时语义分割,本文的方法取得了最好的分割效果,实现了高精度实时语义分割,并且成功移植到Android手机设备。
其他文献
基于视频内容的标注能够有效地对视频进行分类和检索,因此它一直是广大研究者关注的问题。在该问题上,传统的机器学习方法需要人工标注大量的样本,这会耗费很多的人力物力,而使用迁移学习方法可以很好的利用相关领域的知识来训练模型,从而完成对视频内容的标注。由于单源域迁移学习源领域比较单一,可能会由于源域和目标域之间关联程度不大导致迁移的效果不理想,因此本文使用多源域知识训练目标模型,首先将互联网视频知识和图
渤海湾盆地南堡凹陷发育沙三段、沙一段和东三段三套烃源岩,目前对沙三段烃源岩研究认识比较清楚,但对沙一段和东三段烃源岩的生排烃能力及有效性认识不足,导致对南堡凹陷油
随着中国综合国力的增强和国际影响力提高,汉文化在交流传播过程中,以其独有的魅力吸引着全球人民的目光,“汉语热”的出现成为时代发展的必然趋势。因此,要发挥对外汉语的文
大规模多输入多输出(Multiple Input Multiple Output,MIMO)技术因为其大吞吐量、高频谱效率等优点成为了第五代通信系统(5G)的关键技术之一。在大规模MIMO系统中,基站端获得准确的信道状态信息(Channel State Information,CSI)是发挥其性能优势的前提。这是因为大规模MIMO系统中的一些关键技术,比如预编码技术、功率分配技术和调制技术等都是建
如今面对与日俱增的数据规模与数据复杂性,Spark大数据分布式数据处理平台以其高性能的缓存机制及高扩展性的特点被业界广泛应用。但是当面对数据密集型应用时,Spark集群仍然
从2010年起,许多中概股的企业价值被低估,且接连受到做空机构攻击,所以陆续开始筹划回归A股事项,并于2015年掀起一股回归的风潮。但盲目的回归助长了套利行为,催生壳资源的炒作,因此监管部门提出要对中概股回归问题深入研究,严格审核,许多回归计划被终止。直到2018年,证监会声明将积极支持优质中概股回归A股市场,可见我国旨在将真正优质的企业接纳回国,提升A股市场上企业的整体质量。鉴于中概股回归对资本
现今,优化问题早已渗透到如工程、科学、工业等大多数领域中。以生物智能为基础发展起来的仿生群智能优化算法具有并行高效的、通用性强、无需问题特殊信息等优点,为解决优化问题提供了新的思路。萤火虫算法(FA)是一类受萤火虫群体发光行为信息的启发演变过来的新型仿生群智能优化算法,算法通过搜索域内更亮萤火虫吸引其他个体向其移动,实现位置更迭。本文针对传统萤火虫算法存在的求解精度低、稳定性弱、易陷入早熟收敛等缺
近年来,分布式信号处理技术迅速发展,通过实现网络中每个传感器的本地处理和相邻传感器之间的通信,提高了网络的可扩展性和灵活性。目标跟踪作为信号处理领域的热点问题之一,
为了有效提高软件开发质量,减少由于程序设计和不良编码风格导致的代码异味,亟需对异味处理方式进行改进,即提高重构效率。由于重构的成本较大,且不同的代码异味对软件系统来说并非同等重要,本文提出了两种不同的重构策略,以不同的异味排序方法来着重关注那些有较高概率出现异味的类。此前,对于代码异味排序的研究,主要分为基于种类级(kind)和基于实例级(instance)两类。基于种类级的异味排序主要是对不同异
维生素D3(Vitamin D3,VD3)作为重要的激素前体,它是人类、动物生长和繁殖必不可少的一种物质。VD3其母核结构中的C1α位或C25位若发生羟基化作用,可以形成具有生理活性的VD3,具