【摘 要】
:
目标检测是计算机视觉中最具挑战性的问题之一,其目的是检测图像中特定目标的位置,已广泛用于人脸识别、自动驾驶、行人检测、视频监控等领域。基于深度学习的方法由于其无需进行人工特征设计、具有良好的特征表达能力及优良的检测精度,成为当前目标检测算法的主流。针对特征金字塔网络易丢失细节和检测速度慢等问题,本文提出了高效轻量化特征金字塔网络及其目标检测算法。主要工作如下: 与基于图像金字塔的目标检测方法相比
论文部分内容阅读
目标检测是计算机视觉中最具挑战性的问题之一,其目的是检测图像中特定目标的位置,已广泛用于人脸识别、自动驾驶、行人检测、视频监控等领域。基于深度学习的方法由于其无需进行人工特征设计、具有良好的特征表达能力及优良的检测精度,成为当前目标检测算法的主流。针对特征金字塔网络易丢失细节和检测速度慢等问题,本文提出了高效轻量化特征金字塔网络及其目标检测算法。主要工作如下:
与基于图像金字塔的目标检测方法相比,基于特征金字塔的方法速度更快,更能充分利用不同卷积层的特征信息。现有基于特征金字塔的方法采用逐元素相加的方式融合不同尺度的特征图,在融合过程中易丢失低层细节特征。基于此,本文提出一种多层特征图堆叠网络(Multi-feature Concatenation Network, MFCN)及其目标检测方法。该网络以特征金字塔网络(Feature Pyramid Network,FPN)为基础,设计多层特征图堆叠结构,实现不同语义层之间的特征融合,可有效克服低层细节信息丢失问题。同时,结合ResNet101的高层卷积特征图,实现多尺度目标检测。在多个数据集上的实验结果表明,所提算法的检测精度都优于FPN算法。
相对于单阶段目标检测方法,双阶段目标检测可实现更高的检测准确率。目前在双阶段检测算法中,分类回归子网络采用两组全连接层设计,导致检测速度缓慢。基于此,本文提出一种轻量化特征金字塔网络(Lightweight Feature Pyramid Network, LFPN)及其目标检测方法。该网络以FPN为基础,通过深度可分离卷积代替传统的全连接层,实现了分类回归子网络的轻量化设计。同时,设计特征图压缩模块,减少了输入到区域生成网络的特征图数量。在多个数据集上的实验结果表明,所提算法在精度损失较小的情况下,检测速度远超FPN。
其他文献
表皮生长因子受体(Epidermal growth factor receptor,EGFR)信号通路分布在人体的多个器官中,该信号通路调节多种生物学的关键过程,包括细胞增殖,分化和迁移。EGFR信号通路失调又与多种疾病相关,如癌症发生。 信号通路的调控是复杂而且精密的,其中一方面就体现信号的调控依赖于受体与多个配体的结合。哺乳动物中,可与EGFR结合的配体有七个,分别是表皮生长因子(Epide
日本沼虾作为中国重要的淡水经济虾类,具有重要经济价值。对沼虾健康养殖的需求促使关注其免疫防御和抗逆性机制。当生物暴露于病原微生物、重金属等各类胁迫环境时,体内的应激蛋白如金属金属硫蛋白(metallothionein,MT)和热休克蛋白(heat shock protein,HSP)等往往会上调表达,以帮助宿主对抗有害刺激,维持内环境稳态。甲壳动物的MTs和HSPs属于两个大的基因家族,在抗逆过程
该文采用蒙特卡罗方法(MCS)对气体电子崩的发展进行模拟.该文分析讨论了随机变量和随机数对蒙特卡罗模模型的收敛性、精度和误差的影响;改进了计算单一气体电子崩放电的蒙特卡罗模拟方法;提出了计算混合气体电子崩发展的蒙特卡罗模型;并对蒙特卡罗方法计算电子崩发展的特点以及应用前景进行了探讨.蒙特卡罗方法直接模拟大量电子在电场中的电子崩发展过程,其计算结果的准确性直接取决于截面的选取和校正.采用校正后的碰撞
压缩感知(Compressive Sensing,CS)理论作为一种新的数据获取框架,其优势是从低维的观测值中重建高维的稀疏(或可压缩)数据,降低采样成本。观测矩阵与观测值的生成、数据重建精度密切相关,是CS理论的一个重要研究方面。经典随机矩阵的高计算复杂度和其随机结构与一些实际应用领域的不一致性,使得结构化观测矩阵的研究日益受到关注。尽管结构化观测矩阵的研究取得了一些成果,但在一些实际领域出现的
视频中的异常行为分析在交通监控、社会安防等领域有着广泛的应用,近年来已经成为计算机视觉研究的热点之一。本文针对视频中运动目标的轨迹信息提取和异常行为分析开展研究。运动物体的轨迹能够提供目标运动行为模式的宏观信息,而且与视频数据相比,轨迹信息易于储存、传输和分析,尤其适于交通场景下的长时间车辆监控。因此,本文以运动目标的轨迹作为行为的主要表征,研究异常行为分析的几个关键技术问题。一方面,研究用于视频
合成孔径雷达(Synthetic Aperture Radar,SAR)遥感与光学遥感相比,能够全天时、全天候、全地域进行实时数据采集,成像效果不受时间、气候和地域的影响。同时,合成孔径雷达成像分辨率与目标距离无关,在国防和民生方面具有非常重要的作用。由于其相干成像机制,合成孔径雷达图像中不可避免地会产生斑点噪声。斑点噪声是一种依赖于观测信号的颗粒状噪声,是相干成像系统中固有的噪声,相干斑的存在降
随着对海洋资源环境越来越多地开发利用,人们对海洋信息的采集要求不断提高,测量船作为信息采集设备的主要载体,对其航行控制,尤其是航迹控制,也提出了更高的要求。自动舵是实现航迹保持的主要设备,在测量船航行过程中,由于受到海上环境的干扰,会偏离预先设定的航线,此时需要自动舵装置控制船舶改变航向,使船回到规定的航线上,这样测得的数据才是我们预期中想要得到的数据。 近年来,人工智能技术发展迅速,应用也越发
低频微振动在我们日常生活中、工业领域中随处可见,如生命体征监测、桥梁楼宇质检、地震监测等。但是,对低频微震动的测量参数获取比较复杂和困难,其被测对象形貌复杂,振动频率通常在几个赫兹范围,振动幅度在毫米,甚至亚毫米级别。因此,传统的接触式测量方法具有一定的局限性。为了实现快速、精确的全场振动测量,非接触式光学图像测量方法提供了一种合适的解决方案。非接触式光学图像测量方法是通过振动信号对图像特征点的像
雾霾天气下拍摄的图像存在细节模糊、色彩偏移、低对比度等问题,严重影响户外视觉系统发挥效用。因此,雾霾图像清晰化研究具有重要的理论意义和应用价值。论文根据雾天图像成像特点,针对目前基于统计先验和基于学习方法去雾后图像易出现颜色失真、细节模糊及噪声放大等问题,提出了新的见解和方法。论文主要工作如下: 首先,为了避免图像去雾后细节模糊和噪声放大,将图像分解为结构层和纹理层,并只对其结构层进行去雾。基于
随着计算机的普及和数字图像处理技术的进步,计算机视觉技术得到了飞速的发展,利用深度学习的方法进行目标检测与识别,较传统的目标检测与识别方法,实现了自动化、智能化和高效化,且具有更高的检测识别精度。 红外图像与可见光图像相比较而言,其抗干扰能力更强,红外图像的目标检测变得越来越重要,尤其是在军事领域和恶劣环境下。然而现如今,目标检测技术主要集中在可见光图像领域,可见光图像与红外图像成像原理不同,因