基于深度学习的目标检测算法研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:lewy540
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测任务是通过计算机从采样得到的图像或视频中快速,有效寻找感兴趣目标并对其定位,给出所属类别。目标检测作为计算机视觉的一个基本问题,也是当下的热点问题、难点问题,具有很高的研究价值和应用价值。目前的方法尚未达到通用检测任务所需的精度与速度。并且存在着对小尺度目标检测精度低,目标对象定位精度差,对形变目标检测能力不足等问题。因此,本文的研究目标是通过分析这些问题并提出相应的改进目标检测模型以解决对应问题,最终提升模型的检测精度。首先,针对小尺度目标问题与定位效果不佳问题,本文提出了一种利用全卷积网络实现定位分支的目标检测模型DF RCNN。其使用Faster RCNN作为基础框架,采用特征提取效果更好的骨干网络,采取多尺度特征融合策略,构建特征金字塔,丰富特征包含的语义信息,使其适应尺度不同的目标。之后,采用ROI Align技术避免池化带来的精度损失。同时利用全卷积的空间信息保留能力替代全连接形成目标定位分支。对目标进行更精准的定位。同时,对于目标检测中标准卷积空间采样固定,无法灵活采样,且对柔性目标检测精度不足等问题。本文提出一种结合可变形卷积与掩码信息的多尺度目标检测器,该检测器改善主干网络中的固定卷积,结合金字塔技术实现多尺度信息融合,对候选区域采用改进Soft NMS进一步优化,最终通过检测模块获得最终结果,实现了对滤袋的有效检测。最后,本文为了验证上述目标检测模型的有效性,分别在Pascal VOC2007,Pascal VOC2012和本文构建的吸尘器尘袋数据集上进行了测试。结果显示DF RCNN能够对小尺度目标进行有效检测,同时对目标的定位结果优于其他模型;融合可变形卷积Mask RCNN相较对比模型可以对滤袋进行有效检测。
其他文献
得益于控制技术的进步以及材料学的不断更新换代,电磁轴承在一些机械工业生产用具领域如各类工作母机、空气泵、同步发电机以及液氦泵等各种利用旋转对外输出的机械用具得到
随着国家经济的高速发展,煤炭等不可再生性化石能源被大量燃烧利用,同时,燃烧过程会产生大量的污染性气体,对环境造成无法逆转的危害。因此,新能源的开发与利用逐渐引起人们
基于蒙特卡罗积分方法的渲染器由于其灵活性以及普遍性,在渲染真实感场景、计算机动画制作以及视觉产品生成等方面有着广泛的应用。由于这种方法仅能随机地对有限的光线路径
许多大气气溶胶颗粒都会带有一定程度的多余电荷,研究表明沙尘颗粒带电量可达上千微库仑每千克。沙粒在空中运动,由于携带多余电量,在空中产生强风沙电场,从而使带电沙粒受到
图像分类问题一直以来都是计算机视觉领域中一个十分热门的研究课题。无论是日常生活,还是医疗诊断、军事活动,图像分类都起着十分重要的作用。互联网的普及,电子设备的更新
随着信息时代的进步,人们获取多媒体信息日益便捷,视频娱乐也渐渐成为了人们生活中不可缺少的一部分。而视频处理软件的进步使得视频篡改的技术成本大大降低,致使现在被篡改视频随处可见。在此情形下,除了需要提高网络内容监管力度,更需要对篡改视频进行有效的检测。所以无论是从理论研究价值考虑,还是从社会价值考虑,对视频篡改检测算法进行研究是非常有必要的。视频复制-粘贴是一种常见的视频帧内篡改方式,此篡改能在视频
欠驱动TORA(Translation oscillators with rotating actuator)系统是具有强耦合的非线性系统,控制力仅为电机的驱动力,而被控自由度有两个,即框架位移与电机摆角;TORA系统要
量子阱红外探测器(QWIP)是20世纪末发展起来一个新技术,与其它材料的红外探测技术相比,它具有可重复性高、加工工艺成熟、均匀性好、响应速度快,探测波长范围广,探测的波长可以通过调节量子阱的参数加以控制等优点。通过半导体工艺可以制备出高品质、大面积均匀的量子阱材料,容易做成焦平面阵列,常用在成像系统中,在国防,工业,医学等领域有广泛的应用。自从贝尔实验室研制出第一个QWIP以来,其技术得到快速的发
主动容错控制(Fault-tolerant Control,FTC),是一种系统元件在运行时发生故障的情况下,通过对所发生的故障进行补偿的方式,来确保系统能够安全、可靠、正常稳定的运行的控制
以风沙运动为标志的土地荒漠化及其引起的沙尘暴等灾害,是21世纪重要的环境问题。而对这一典型气固两相流体的动力学求解,面临着诸如Navier-Stokes方程的非线性、湍流运动的