【摘 要】
:
目标检测作为计算机视觉中最热门的研究领域之一,在很多实际场景都具有重要的应用价值。本文对基于深度学习的目标检测方法进行研究,YOLOv4作为目前主流的一阶段目标检测方法,可以较好地平衡检测精度和速度,因此本文选取其作为研究对象。针对YOLOv4存在对深层和浅层信息特征提取不充分以及信息利用率不足的问题,对其进行改进,力求在保证检测速度基本不变的同时尽可能地提升精度。本文的主要研究内容和创新性工作如
论文部分内容阅读
目标检测作为计算机视觉中最热门的研究领域之一,在很多实际场景都具有重要的应用价值。本文对基于深度学习的目标检测方法进行研究,YOLOv4作为目前主流的一阶段目标检测方法,可以较好地平衡检测精度和速度,因此本文选取其作为研究对象。针对YOLOv4存在对深层和浅层信息特征提取不充分以及信息利用率不足的问题,对其进行改进,力求在保证检测速度基本不变的同时尽可能地提升精度。本文的主要研究内容和创新性工作如下:(1)针对YOLOv4目标检测器深层和浅层信息特征提取不充分的问题,提出了一种新的基于扩张坐标注意力YOLOv4的目标检测方法,即YOLOv4-D。该方法使用具有不同扩张率的多个扩张卷积对注意力机制模块进行改进,提出了扩张坐标注意力模块,并将其置于主干网络的浅层特征层之前,使得不同感受野下的特征映射得以融合,浅层网络的特征提取能力得到显著提升。同时采用多尺度训练策略增强鲁棒性。最后在PASCAL VOC2007和VOC2012上进行实验,并与其他先进的目标检测方法进行对比,实验结果表明,提出的YOLOv4-D检测精度优于YOLOv4及其他目标检测方法。(2)针对YOLOv4目标检测器存在信息利用率不足的问题,提出了一种新的基于改进的路径聚合和池化YOLOv4的目标检测方法,即YOLOv4-P。为了充分利用路径聚合网络可以有效防止信息丢失这个特点,对YOLOv4的路径聚合网络进行改进,利用主干特征提取网络的第二个残差块,新增一个检测层,加强融合浅层特征层。另外,使用K-means聚类对数据集重新进行处理,获得合适的先验框尺寸。此外,图像经过主干特征提取网络后的感受野比理论感受野小,为了增大感受野,在主干特征提取网络的后端加入金字塔池化模块,利用4种不同尺度的金字塔池化引入不同尺度下的特征信息。最后,在PASCAL VOC2007和VOC2012进行仿真实验,实验结果表明,提出的YOLOv4-P有效提高了检测精度。(3)为了进一步验证提出的YOLOv4-D和YOLOv4-P的性能,将二者进行结合,得到一个新的YOLOv4-Z目标检测方法。在两个数据集上进行仿真实验并对实验结果进行分析。YOLOv4-Z在两个数据集上的m AP与YOLOv4相比分别提升了2.25%和2.11%。在PASCAL VOC2007数据集上,与提出的YOLOv4-D和YOLOv4-P相比,YOLOv4-Z分别提升了0.41%和0.22%,在PASCAL VOC2012数据集上,分别提升了0.2%和0.17%。提出的YOLOv4-D和YOLOv4-P两种目标检测方法与YOLOv4相比,检测精度都有提升,且YOLOv4-P更优,将二者组合提出的YOLOv4-Z具有更好的检测效果。实验表明YOLOv4-Z在检测速度没有较大变化的情况下比结合前的检测精度更高,比其他先进的目标检测方法更具优势。
其他文献
调制识别在军事和民用领域中得到了大量的应用:军事上调制识别是进行电磁干扰实施、电磁威胁评估分析、电磁环境监测等电子战措施和手段的基础;在民用领域例如软件定义无线电和认知无线电这类智能通信系统中也发挥很大的作用。循环谱作为信号分析工具有许多优点。它对先验知识要求低、提供更丰富的分析域、可有效减小平稳噪声及干扰信号的影响、比传统的功率谱包含更多的参量信息。论文以战场电磁环境为背景重点研究了常见数字信号
近年来,为推动建筑行业的发展,结合BIM技术的特有优势,政府大力提倡在工程建设的各个阶段引入BIM技术,以配合项目管理,最终完成我国建筑行业的转型和升级。当BIM广泛应用于工程管理各阶段时,工程审计的环境也会出现相应的改变。本文首先阐明了BIM情境下工程审计的主要研究背景与其意义、主要研究内容、主要研究方法等,并进一步明确了论文的主要创新点。然后,论文从BIM技术在工程管理中的应用以及BIM技术在
我国进入并将长期处于老龄化阶段以及在人们对高健康品质生活的需求背景下,以康养旅游为主导产业的特色小镇随之出现,康养旅游特色小镇作为新兴业态发展模式,依托第一二三产业与医疗、健康、旅游、文化融合发展,能有效破解我国人口老龄化日益严重问题,对拉动经济增长、推动行业升级、调整产业结构、带动农民创效增收以及现代经济深入农村发展有明显作用。文章采用文献查阅→案例研究→田野考察→综合分析→归纳总结方法,总体从
【目的】了解大学生线上医疗知识付费意愿现状及其影响因素。一方面从性别、健康状况等方面分析大学生线上医疗知识付费意愿的人口学特征差异;另一方面分析各因素对大学生线上医疗知识付费意愿的影响。为互联网医疗商业化和线上医疗知识产品化提供优化方向,为线上医疗知识付费产品提供商提高用户线上医疗知识付费意愿提供参考。【方法】在前人成熟量表的基础上,设计大学生线上医疗知识付费意愿量表,量表包含绩效期望、易用期望、
随着经济全球化的不断深化和互联网技术等高新科技的持续发展,生产制造业和商贸流通业也蓬勃发展。与此同时,市场空间增长速度的放缓和同行业企业的不断加入,让生产制造业企业和商贸流通企业的管理者都有了更强的危机感,希望借助供应链成本控制理论提高企业的成本控制水平,从而使企业在激烈的市场竞争环境中生存下来。由于国内学者和企业管理者生产制造企业和商贸流通企业的成本构成了解不充分,两种企业的供应链环节又有所差异
传统历史街区是历史名城重要的文化遗存,历史街区的建筑群更是城市发展的见证,它封印着历史记忆,推动着城市文脉绵延发展的进程。从1986年国务院公布的第二批国家历史文化名城的名单中明晰概念开始,随后建设部也明确了历史名城保护应具有历史的真实性、风貌的完整性、维护生活的延续性等原则。杭州是南宋古都,是具有江南文化特色的名城,自古有“上有天堂,下有苏杭”之美誉。杭州皇城御街是古都临安的皇城所在地,是政治、
殡葬改革政策由于涉及根深蒂固的传统丧葬习俗,政策的执行往往面临重重阻碍,特别是在基层社会治理中,殡葬改革政策执行的差异性和复杂性更加凸显,其执行效果也成为备受社会关注的议题。在中国各地的殡葬改革政策执行实践中,地方政府的殡葬改革政策执行情况呈现出较大的地方性差异。其中既有以S省Y县为代表的“惠民礼葬”典型样本,也存在着S省T县等蜕变成“伪作为”的执行异化现象。基于对事实的把握和思考,研究着力研究以
在地铁站的施工中普遍使用明挖法施工,该施工方法中涉及到开挖深基坑,但是深基坑的开挖所涉及到的理论知识以及技术要求极其复杂,现场基坑所处条件不可一概而论,根据当地地勘以及水文环境,所采取的的措施以及施工方案也是不同的。在人员密集场所开挖基坑,一旦出现基坑坍塌,将会产生无法估量的后果。因此,在开挖深基坑前,基坑的开挖以及施工技术的确定显得至关重要。本文以宁波市地铁三号线客运北站基坑工程为研究背景,通过
当前,数字化已经深刻改变了金融、物流、交通、旅游、零售、住宿、餐饮等服务业,逐步向制造业渗透,制造业成为数字化转型的主战场。新基建的推进和新冠疫情的爆发,更是加速制造企业数字化转型的实践步伐,“从哪里转”和“怎么转”成为制造企业急需解决的问题。企业界的快速发展促使制造企业的数字化转型成为学术界的研究热点。然而,当前学术界缺乏如何触发制造企业数字化转型的探讨;此外,关于数字化转型路径研究集中于数据视
近些年,随着深度学习在计算机视觉领域取得的巨大成功,其也在无设备人体活动识别领域给了人们新的启发。人体活动识别的方法分为基于传感器的、基于图像的和基于射频信号的。上述几种传统方法都是在采集到信号后,经过信号预处理,使用不同的分类器对动作进行分类。基于射频信号的人体活动识别技术因其不受光线限制、无需穿戴设备以及不侵入人们的隐私的优点在近些年的研究中更加受人青睐。深度学习在人体活动识别方面的应用可以对