基于YOLOv3的融合注意力加权的特征关联行人检测算法

来源 :燕山大学 | 被引量 : 0次 | 上传用户:wxhex2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉领域中,行人检测技术可以应用到很多场景中,所以一直是众多学者研究的热点之一。行人是城市道路交通的重要参与者之一,因此开展行人检测的研究对城市智慧交通、自动驾驶、智能安防等的发展都具有十分重要的意义。由于深度学习技术能够提取更为有效的特征,行人检测算法大多采用基于深度学习的方法来进行研究,但这些行人检测算法仍旧存在着一些弊端,大部分的检测算法很难达到检测效果与检测速度共赢的局面。本论文针对上述问题进行了一些研究:首先,本文对现有的目标检测算法的研究现状和基本概念进行了深入调研,并且对当前深度神经网络的基础算法进行了研究和分析。其次,本文分析了行人特征提取的缺点,并针对特征利用率低和特征提取精准度不足的问题,设计了融合注意力的特征提取网络。详细介绍了特征提取网络的特点,以及具体实现过程,描述了特征提取模型的整体结构。再次,本文针对行人检测精准度不够的问题,在深度学习的框架下,设计了一种基于YOLOv3改进的实时行人检测算法。该算法通过融合注意力的特征提取模型进行特征提取,获得具有权重加成的特征。然后基于GIo U的度量方法设计了损失函数。此外,还对检测模型的整体设计及训练过程做了详细的描述。最后,本文在Pytorch深度学习框架下进行了算法的验证实验及性能分析。
其他文献
文本生成图像问题是图像生成方向的一个重要分支,给定一个文本描述,可以生成符合文本描述的图像。文本生成图像的方法主要是基于生成对抗网络的,目前的一些方法经常出现模式崩塌问题,生成的结果缺乏多样性。本文为了提高生成图像的质量做了以下工作:首先,为了解决训练过程比较自由缺乏约束的问题,本文提出了语义分类器生成对抗网络。将文本预处理后得到文本向量,与随机噪声连接在一起输入到生成器中,通过卷积层生成图像。然
双线性广义近似消息传递算法是广义近似消息传递算法的拓展,是一种具有高性能的迭代阈值算法。本文主要就双线性广义近似消息传递算法的研究及其应用进行了以下几方面的研究工作:首先,研究了一种基于双线性广义近似消息传递低秩矩阵填充的图像去噪算法。该算法利用自然图像中非局部相似块形成的矩阵具有低秩性这一性质,将匹配图像块的去噪问题转化为低秩矩阵填充问题。实验结果表明,该算法能够有效去除图像中的混合噪声,与经典
石油作为当今世界工业第一能源要素,被称为“工业的血液”。石油资源关系到国家能源安全,对社会发展起着至关重要的作用。我国正处于经济发展期,对石油的需求量与日俱增,但是我国石油储量有限,许多老油田已全面进入开发中后期,开发难度增大,需要完善开采技术来挖掘剩余油潜力。注水是补充油田能量的重要技术手段,为解决油田开发后期测调工作量大、注水合格率下降快等问题,发展了智能分层注水工艺。基于智能分层注水工艺现状
近年来,扭转作为监测应力及内部状况的一个重要参数,受到了国内外研究学者的广泛关注。其中,与电学和磁学扭转传感器相比,光纤扭转传感器具有结构简单、易于制备、灵敏度高以及抗电磁干扰能力强等优点,被广泛应用到户外安全检测以及桥梁监测等领域之中。本文在分析总结不同结构的七芯光纤传感器国内外研究现状的基础上,采用七芯光纤作为传感单元,制备了两种不同结构的七芯光纤微腔结构传感器,并在顺时针及逆时针两方面对其扭
单幅图像去雾任务作为计算机视觉任务领域中的重要组成部分,在目标跟踪、无人驾驶等视觉任务中都承担着重要的作用。因此,在多样的计算机视觉任务中,如何在单幅图像中高效地获取更好的去雾效果成为单幅图像去雾任务中的关键问题,同时也是计算机视觉领域中一个亟待解决的难题。通过深入分析国内外单幅图像去雾方法的研究现状,同时结合深度学习思想及计算机视觉的相关知识,对如何在单幅图像中高效地获取更好的去雾效果进行了深入
近年来,疾病诊断相关组(Diagnosis Related Groups,DRGs)在不同地区的医疗服务提供者评价和医疗支付方式应用中分组效果不理想。机器学习方法是研究分类问题的重要方法之一,与传统的DRGs分组方法相比具有较大的优势。因此本文采用基于机器学习的分类算法对本地化DRGs分组和分组预测进行研究。首先,针对现有的DRGs在不同地区的应用中部分病例无法入组的问题,提出面向本地化的DRGs
鱼类图像识别是监测鱼类种群与研究渔业资源的重要基础,然而图像中的鱼类目标在背景、形态、大小等方面都存在着较大的差异,这使鱼类图像识别面临着诸多的挑战。随着深度学习技术的发展,该领域中的卷积神经网络模型具备良好的图像特征提取能力和优异的泛化性能,这为鱼类图像识别提供了新的解决思路。本文从鱼类图像分类和鱼类目标检测两个方面开展鱼类图像识别工作的研究,通过对相关卷积神经网络模型进行研究及改进,以达到更好
随着人工智能的迅速发展,深度强化学习算法被广泛地应用在机器人领域,以解决机器人操作技能学习问题。推动和抓取技能是家庭服务机器人最基本、最主要的技能。针对家庭服务机器人目标推动与抓取操作技能学习阶段面临训练成本高、动作效率低等诸多问题,本文结合深度强化学习算法并加以改进,基于此设计更加高效的家庭服务机器人目标推动与抓取操作技能学习算法,以提高家庭服务机器人在复杂环境下的感知能力和自主决策能力,具体研
近年来,国内多个地区受雾霾气候影响较为严重,对生态环境和人们的身体健康形成危害。PM2.5浓度超标是造成雾霾的主要原因之一,探究PM2.5浓度变化的规律成为空气质量预测研究的主要内容。精准有效的空气污染物浓度预测方法有助于预防雾霾气候所带来的影响,同时可为制定大气污染治理策略提供参考价值。空气污染物在时间维度上的预测可看作为一个多变量的时间序列预测问题,而当前所提出空气质量预测方法中,绝大部分忽视
随着机器人技术的快速发展,对移动机器人路径规划问题、导航问题、定位问题的研究提出了新的挑战。围绕路径规划问题,日趋复杂的应用场景,对机器人规划算法的要求不断提高。单一的规划算法已不能满足机器人在真实工作环境中的需求。针对此问题,本文以QBot2移动平台为研究对象,围绕移动机器人的全局轨迹规划问题、多移动机器人局部避障问题、复杂环境下移动机器人混合轨迹规划问题这几个方面展开研究。首先,分析了QBot