基于注意力机制与多尺度残差网络结构的目标检测算法研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:huacheng5215
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的不断发展,计算机视觉领域中的目标检测技术已经被应用到人类生活的许多方面。例如安防、智慧城市、无人驾驶、智能机器人等领域都应用到了目标检测技术。由于应用场景的复杂性,目标的检测技术依然存在着许多挑战。近年来,Faster R-CNN算法在目标检测领域应用较为广泛。然而,该算法中存在以下两个问题:1)在卷积神经网络内部大量使用较小的卷积核,导致特征图长距离相关性较弱的问题。2)在特征金字塔网络内部存在多尺度特征融合不充分的问题。本文针对以上两个问题开展研究:1、针对Faster RCNN目标检测算法在卷积神经网络内部存在特征图内部长距离相关性较弱的问题,本文结合视觉注意力机制提出AT-FCNN(Attention-Faster Convolutional Neural Networks)目标检测算法。该算法将注意力模块嵌入到卷积神经网络内部,在卷积神经网络进行特征提取的过程中,通过注意力模块计算特征图内部特征之间的相关性系数,达到增强特征图表征能力的效果。最后,本文在公开数据集中对算法的有效性进行验证,实验结果显示本章算法在平均精确度值方面得到5.8%的提升。2、在Faster R-CNN算法框架内的特征金子塔网络中,由于原始特征融合策略采用深层特征图向浅层特征图融合的方式,使得浅层特征图充分包含了多层特征信息,而深层特征图并没有融合到浅层特征图的特征信息,最终导致多种尺度特征融合不充分的问题。本文针对上述问题,结合视觉注意力机制,提出ATF-FCNN(Attention Feature Pyramid-Faster Convolutional Neural Networks)特征融合算法。该算法首先将多尺度特征信息固定到同一尺寸,进行特征融合,并输出该种尺寸的融合特征图。其次,将融合特征图送入到注意力模块内进行处理。最后,将处理后的特征图采用上采样或者下采样的方式,重新转换成特征金字塔多尺度特征的形式,输入到下一阶段网络使用。本文在公开数据集中对该算法有效性进行验证,实验结果显示本章算法性能得到更进一步的提升。综上所述,本文通过基于注意力机制的Faster R-CNN目标检测算法的研究,其实验结果表明有效的解决了所提出的问题,并在算法整体性能方面的获得了明显的提升,达到了预期对目标检测算法学习与研究的目的。在目标检测方面给出了新的理论解决方案,同时具有较强的现实意义。
其他文献
中国每年新发脑卒中患者200万,年龄标化发病率约为21/6250,已成为我国国民首位死因。随着治疗技术进步,脑血管疾病的病死率逐步下降,但70%~80%患者会遗留不同后遗症[1],而肩
“三个代表”重要思想的指导地位与思想政治工作理论的现状,决定了用“三个代表”指导思想政治工作理论创新的必要性与紧迫性;必须着眼于“三个代表”重要思想的贯彻落实和指导
为切实将降本增效工作落到实处,兰州石化公司化肥厂水汽车间根据生产实际,狠抓技术攻关、紧盯技改技措,进一步优化车间生产运行模式.5月21日上午10点,水汽车间按照前期制订的
针对轻烃厂广安站在低负荷运行状态时电耗偏高的问题,通过对全站用电设备用电情况逐一进行分析,以及现场调查和生产数据资料查阅,确定了循环水泵流量、分子筛系统再生间隔时
商业银行加快数字化转型,人工智能是其中不可或缺的重要动能。银行应严格按照《规范》要求,夯实人工智能发展基础,为数字化转型提供更加稳定和有力的保障。$$近日,人民银行发
报纸
20世纪中期,全球出现了经济全球化、信息化和人类可持续发展三大趋势,改变了社会与经济发展的传统观念。青岛市在继“建设现代化国际城市”、“五个中心”后,提出了“建设区域经
城市化既是推动区域经济国际化的一项重要战略措施,又是一个城市现代化水平的重要标志,还是增强城市竞争力的重要举措。青岛开发区要建成“青岛的明天”,必须大力推进城市化建设
信用是市场经济的基础条件,又是企业的无形资本,如何经营好信用资本,本文从政府、企业和市场多层面进行了有益的探索。
在中国经济迅猛发展的过程中,出现了民工大量涌向城市的现象,它虽然带来了一些社会问题,但它是二元经济的必然现象。民工为中国经济的高速增长做出了巨大贡献。城市行政管理者有
乡镇行政管理体制改革是我国行政管理体制改革的有机组成部分。随着我国村民自治深入发展,农村税费改革不断推进,乡镇行政管理体制改革越来越受到社会的广泛关注。本文对理论界