基于深度卷积神经网络的目标检测方法研究

来源 :中北大学 | 被引量 : 0次 | 上传用户:davidrandy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测广泛应用于图像检索、视频监控、军事侦察等领域,其任务是从复杂场景中自动标识出目标的分类信息与位置信息。鉴于传统的建模方法存在移植性差等问题,新近深度学习已成为研究目标检测的主要手段。为了提高基于深度学习的目标检测准确率,本文以目标分类与目标定位作为主要突破点进行了以下研究:(1)针对特征金字塔网络(Feature Pyramid Network,FPN)只能单向将高层信息融入低层信息,影响目标分类和定位的问题,提出基于双向特征金字塔的目标检测方法。首先,对图像预处理,扩充为统一大小;其次,采用FPN生成、融合多尺度特征映射图,并利用双向特征金字塔对特征映射图采用自下而上的反向侧边连接方法进行连接;然后,将连接后的特征映射图分别输入至区域建议网络(Regional Proposal Network,RPN)和RoIAlign池化层(Region of Interesting Align Pooling,RoIAlign Pooling),RPN对其提取边界框再输入RoIAlign Pooling;最后,根据损失函数对网络进行调整。该方法有效地双向融合了高层和低层的信息,成功解决了FPN单向融合造成的分类和定位不准确问题,提高了目标检测的准确率。(2)针对RPN在对建议框区分正、负样本采用单一阈值出现的误检框、过拟合及准确率提升有限造成定位不准确的问题,提出基于多阈值迭代区域提取的目标检测方法。首先,对图像进行预处理;其次,利用共享卷积层提取特征,再采用双向特征金字塔双向融合高、低层特征映射图的信息;然后,将特征映射图输入多阈值迭代区域建议网络和RoIAlign Pooling,多阈值迭代区域建议网络通过对建议框设定多个阈值来区分其正、负样本,并对正样本进行分类回归;最后,将多阈值迭代区域建议网络输出的建议框输入至RoIAlign Pooling,对提取的目标区域和信息进行回归和分类。该方法有效地区分了锚点框中的正、负样本,成功解决了单一阈值造成定位不准确的问题,使得检测目标的位置更加准确。
其他文献
书面作业的批改是深化教学过程,增强教学效果,检验学习成效的重要手段。赏识教育是一种以人为本的激励式新型教学方法。本文将上述两者有机结合,并从赏识教育内涵和教育激励
氨分离器对氨的生产起重要作用,而氨分离器液位测量的准确性决定其分离效果好坏。通过对传统压差液位测量系统分析,得出其产生误差的原因、解决方法和相应算法。文章首先对设
古埃及人自身的和谐主要体现在"自我塑造"与"培育"的统一以及人内在美德与外在实践的统一。人性善的观念使自我塑造成为可能,大量教谕文献的存在表明了古埃及人对"培育"的重
<正> 再贴现政策工具自1986年就已启动,但直到1994年并未有起色。只是在1994年之后,伴随着金融调控由直接向间接转变的加快,《票据法》的出台与实施,作为一项主要的间接货币
<正>英国剑桥大学近日发表在《神经病学期刊》上的最新研究发现,长期每晚睡眠时间超过8小时者,中风风险也很大,比睡6~8小时者高出46%。这是对欧洲9700名、平均年龄为62岁的人
北宋发行了大量铜币,依然出现了钱荒,同时产生了世界上最早的纸币:交子。本文阐述了钱荒产生的原因及其与交子产生的关系,并进一步剖析了宋朝先进的货币思想。
论莫泊桑短篇小说中的妓女形象邓楠妓女形象是莫泊桑所刻画的女性形象中的一个重要组成部分,在莫泊桑的小说中占有特殊的地位。莫泊桑摒弃社会俗众的偏见,对妓女问题进行了认真
<正> 敖汉旗在1982年秋冬的文物普查中,首次在高家窝铺乡的赵宝沟村大北地发现了性质较单纯的赵宝沟文化遗址。其后又于1983年春的文物普查中,相继发现敖音勿苏乡的烧锅地遗
<正>我们的皮肤能够显得光滑,很重要的原因是皮肤里头一种叫胶原蛋白的蛋白质在支撑着。胶原蛋白占了皮肤干重的70%。但是,随着岁月的流逝,人体皮肤中胶原蛋白的数量逐年在减
马克思主义的生命价值观包含着丰富的内容,概括起来主要有三个方面:生命价值的基础观、生命价值的评价观、生命价值的创造观。现代社会大众文化的兴起与发展对这些观点提出了