【摘 要】
:
近年来,计算机视觉被许多研究学者们所关注,图像目标检测更是其中的研究热点。迅速发展的深度学习技术给目标检测提供了肥沃的土壤和指明了新的方向,各类基于卷积神经网络的
论文部分内容阅读
近年来,计算机视觉被许多研究学者们所关注,图像目标检测更是其中的研究热点。迅速发展的深度学习技术给目标检测提供了肥沃的土壤和指明了新的方向,各类基于卷积神经网络的目标检测模型不断地刷新平均准确率的记录。为了避免像基于传统机器学习的目标检测算法一样用滑动窗口在图像中穷举搜索物体,几乎所有的当前最佳的目标检测网络都使用潜在目标区域提取方法来指导物体实例的搜索。Fast rcnn目标检测框架是使用潜在目标区域提取方法的典型和杰出代表,它将目标检测问题分解为两个阶段,首先从图像中生成大约2000个潜在目标区域,然后将潜在目标区域分类为不同的对象类别并且进行精准地定位。尽管处理的是两个相对简单的任务,该模型仍然有改善的空间。本文主要针对Fast rcnn目标检测框架的不足之处进行改进和优化工作,旨在进一步提高目标检测的平均准确率。首先,训练一个前景/背景SVM二分类器对潜在目标区域进行后处理,旨在剔除绝大部分的简单区域而留下质量较高的少数区域。实验表明本文的分类器有助于减少目标分类的假阳率。其次,和原有模型仅仅使用最顶层的网络特征图进行目标检测不同的是,本文采用特征融合的方式将具有高分辨的低层特征、高度语义的深层特征以及互补性的中层特征组合成一个具有强大判别能力的特征图。实验表明融合特征极大地提高了小物体的检测表现和平均准确率。另外,本文采用焦点损失替代交叉熵损失对原有模型进行优化,实验表明焦点损失函数起到了和难例挖掘相似的作用,使得网络的训练更加稳定和鲁棒。最后将所有的改进和优化措施组合在一起训练本文提出的结合传统机器学习与深度学习的混合式Fast rcnn++目标检测模型,实验结果表明,本文的模型将目标检测的评价指标mAP从67.2%提升到72.2%,并且和当前比较优秀的一些模型相比,取得了具有竞争力和可比较的结果。
其他文献
图像文字检测与识别在计算机视觉领域有着广泛的应用。文字图像大致可以分为两种:文档图像和场景图像。与文档图像相比,场景图像文字的多样性和背景的复杂性给文字检测带来诸
计算设备性能的发展和海量标记数据的出现,使得深度神经网络的训练成为可能。深度神经网络以其强大的非线性映射和特征提取能力被广泛应用在人脸识别、虹膜识别等生物特征识
铀,作为重要的核燃料,可用于核武器和核能的开发,进而促进了原子能工业的发展、缓解了用电成本。然而,在铀矿的开采、核废料和核事故中会产生各种放射性核素,一旦进入饮用水中,危及了人类和其他生物体的健康。因此,设计和制备具有功能性的材料是修复被铀污染的水体系的一个重要策略。近年来,碳基材料具有低廉的制备成本、简单的操作工艺、大的比表面积和良好的化学稳定性等优势,博得了研究者的青睐。但是,原始碳基材料的表
密集异构蜂窝网的广播特性使其面临被窃听的安全问题,物理层安全(Physical Layer Security,PLS)技术利用无线信道的唯一性、互易性等“指纹特性”来保障密集异构蜂窝网的安全
耐火材料广泛的应用于钢铁、化工、建材等行业领域中,21世纪以来,我国国民经济发展迅速,耐火材料的需求量倍增,我国耐火材料行业把握住机遇,实现了大力的发展。近年来,依靠自
随着社会的发展、科技的进步,人们开始意识到信息安全的重要性。利用生物特征信息的稳定性和个体差异性来快速鉴别个人身份信息成为安全领域的首选方式,以保障国家和公民信息
故障检测与诊断为现代复杂系统的可靠性与安全性提供了切实保障。同时,时滞现象广泛存在于实际系统中,时滞的存在常常导致实际控制系统性能下降甚至不稳定,除了存在时滞以外,
多媒体技术快速发展,图像数据资源日渐丰富,如何快速精确地从图像数据库中检索出需要的图像是目前急需解决的问题。为了解决这一问题,本文从小波变换基本理论出发,指出了小波
网络控制系统可以看作是一种离散的数字控制系统,因而采样周期会影响系统的性能。在保证系统稳定性的前提下,求得采样周期的全部可取值范围,将为实际应用以及其他领域的研究
密码函数在保证信息安全方面发挥着重要作用.超Bent函数是一类具有优良密码学性质的布尔函数.基于密码函数的安全性分析,研究超Bent函数的密码学性质,对以超Bent函数为前馈函