基于深度学习的通用目标检测算法研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:lidandanlidd12141
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通用目标检测在无人驾驶、机器人导航、视频分析以及图像理解等领域有重要研究价值,近年来吸引了研究人员的广泛关注。随着深度学习,尤其是深度神经网络的迅猛发展,通用目标检测领域取得了巨大进步。基于深度学习的通用目标检测准确率大大提高,使得无人驾驶、机器人导航等在实际生活中应用成为可能。本文主要研究基于深度学习的通用目标检测,旨在以Faster R-CNN为主干框架,对其进行改进以提高通用目标检测准确率。Faster R-CNN是通用目标检测领域的主流检测框架,然而单个Faster R-CNN框架相对于最新的检测模型已不再具有优势。所以,在基于Faster R-CNN的基础上,本文提出了多个改进方法,来提高其准确率。本文主要集中于特征提取、标准化方法和anchor大小等方面来改进检测结果。在特征提取方面,采用深度神经网络来进行特征提取。由于深度神经网络具有强大的学习能力和较强的表达能力,可以学习到语义性强、多层次、鲁棒性强的特征。同时,还采用了特征金字塔结构来解决多尺度问题。特征金字塔用来生成多尺度特征表示,使模型可以检测不同尺度的目标。标准化方法方面则使用了组标准化来解决小批量问题。组标准化将特征通道分为几组,在每组内计算均值和方差来进行标准化,它的计算和批量大小没有关系,从而避免了小批量问题。此外,使用了K均值聚类算法来确定anchor大小以使网络可以更容易地进行边框回归。通过在以上方面对Faster R-CNN进行改进,在MS COCO2017数据集上,我们的模型相对于Faster R-CNN准确率提高了 1.6%。
其他文献
近年来,项目管理开始在大小型企业中得到越来越多的重视和使用。作为项目管理中最核心的组成部分之一的进度管理,是保障一个项目是否能从开始就能持续,健康和稳定发展的重要措施。随着C公司与国际知名企业的合作越来越深入,石油服务行业开始越来越注重为客户提供一站式解决方案,对于C公司来说,提升技术能力的同时如何提升管理水平,将日益复杂的项目有效管理起来,确保项目能够平稳进行是一件迫在眉睫的事情。随着国内石油服
地震断层破裂的方向性效应对近场地震动强度和空间分布有显著影响,开展破裂方向性效应影响研究对于认识强地震动工程特性和工程结构的抗震设防具有重要意义。本文利用国内外近年发生的重要地震事件中获取的强震动观测记录研究近场地震动空间分布和衰减特征,将观测结果与美国NGA-West2地震动经验预测模型进行对比,揭示近场强地震动的长周期特点,基于统计回归和残差分析定量考察地震破裂的方向性对地震动峰值加速度(PG
随着寿险公司市场竞争日趋激烈,而承保利润逐渐压缩甚至出现亏损的情况下,寿险资金运用投资关系着寿险企业的长期稳定经营发展,如何提高自身的投资收益率,用投资收益来弥补承保的亏损,是寿险企业面临现在需要面临的问题。我国正在改革保险资金运用管理,并拓宽了保险资金投资渠道,此时寿险企业带来机遇的同时也带来了挑战,因为收益与风险是并存的。寿险资金运用会带来投资回报,提高公司利润,但同时寿险资金运用也会受到内外
自古以来,我国便是农业大国,农业的稳定和发展始终是社会稳定、国家繁荣的基础性保障。随着经济的发展,城市化进程的不断推进,大量劳动力涌入城市,农村土地的利用率不断下降,
劳动保护向下竞争理论认为外资会选择进入劳动保护标准较低的国家。本文旨在使用中国数据检验这一理论,我们以2008年《劳动合同法》的实施为准自然实验构建双重差分模型,使用我国A股上市企业数据,样本长度为2003-2012年。研究发现我国《劳动合同法》的实施反而有助于外商直接投资的增长,实证结果表明,《劳动合同法》颁布后,在劳动密集度较高的企业中外资股权比例显著提高。进一步探究《劳动合同法》对外商直接投
在当今的信息社会时代,视频数据呈现爆炸增长的趋势。从海量视频中获取有价值的关键信息变得尤为重要。随着深度学习技术的快速发展,视频理解已成为研究热点。本文从视频亮点检测、时序动作定位等方面进行视频语义研究。在节省视频浏览时间、节约制作视频的成本等方面具有一定的实际应用价值。鉴于视频数据包含图像、文本、音频多个模态的信息,本文提出了一种用于实时自动剪辑视频亮点的多模态分析方法(MAA)。目前,与提取亮
有线电视是电视节目传输的重要渠道,承担着传播党和国家的政策和声音的重要角色,也是广大人民群众文化生活的重要组成部分。广电网络的基本服务是有线电视的信号传输服务,此外还提供视频点播、宽带接入、专业频道和视频电话等服务内容。山东广电网络有限公司(以下简称山东广电网络)是山东地区传输有线广播电视网络、收转和传送有线电视节目的服务商,用户规模和经营总量位居国内领先地位。长期以来山东广电网络独享山东地区广播
5G信息时代下,随着通信技术的快速发展,高频声表面波(SAW)器件的需求急剧增加。如何在提升SAW器件频率特性基础上降低插入损耗是目前的研究热点和难点。针对SAW器件低损耗和高频的矛盾问题,本文主要从压电复合结构和SAW器件结构两方面进行优化探索,对5G信息时代迫切需求的高频SAW器件的低损耗特性具有一定的科学意义和应用价值。本文在硅基衬底上系统地研究了退火温度对ZnO薄膜性能的影响、溅射功率和Z
双向拉伸聚乙烯(BOPE)薄膜作为一种高性能的薄膜材料,具有良好的抗穿刺性能、热收缩性能和透明性,被应用于各类食品及日用品的包装。然而,一般的聚乙烯树脂由于结晶能力强、结晶速率快等特点,在双向拉伸过程中容易出现薄膜厚度不均、破膜等问题,难以满足双向拉伸工艺的要求。此外,现有研究较少且无法有效地指导BOPE专用树脂的开发,严重限制了 BOPE的应用范围。因此研究和开发应用于双向拉伸技术的聚乙烯树脂具
随着军民融合不断向更全方位、更高层次、更大范围和更多领域的深化拓展,军民融合背景下特色小镇开展区域创新活动,即是军民深度融合地方经济社会发展情况下自然反应,也是产业生态中协同创新的挑战。党的十八大以来,军民融合发展作为兴国之举、强军之策的地位和重要性不断凸显,并上升为国家的重大发展战略,在军民融合类产业中结合科研创新活动并完善管理体制机制,不仅可以增强国防科学技术的创新发展和提升国防的实力,也有利