基于卷积神经网络的图像人群计数研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:aihuibulai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的不断发展,人群计数模型的性能得到了显著的提升,然而目前仍面临着诸多挑战。在实际场景中,尺度变化不均,背景干扰,高度遮挡等因素增加了人群计数任务的处理难度。本文针对人群计数现有的难题和挑战,分别提出了两种基于卷积神经网络的模型。本文具体的研究内容如下:1.针对复杂环境下杂乱背景对计数模型干扰的问题,本文提出了基于注意力机制的语义动态优化模型(Semantic Dynamic Optimization based on Attention Mechanism,SDOAM)。该模型主要包含细化路径模块,注意力机制模块和密度图优化模块。其中,细化路径模块主要用于聚合空间信息和减少网络中人轮廓边界的特征损失。注意力机制模块使用卷积网络生成注意力图,减少杂乱背景的干扰。密度图优化模块通过掩膜对密度图的前景和背景进行分离,再使用优化器与计数模型联合训练的方法对密度图进行动态优化,改善了密度图质量。2.针对尺度变化不均,遮挡严重等问题,本文提出了一种基于概率密度图的多尺度优化模型。利用概率密度图保留峰值、易区分相近个体的特点,模型使用概率密度图对中间过程进行监督学习,减少网络过程中的位置信息损失。本文对不同尺寸的预测密度图通过损失函数进行优化,增强了预测密度图的细节特征。模型使用全卷积U型网络结构从低尺寸特征图中提取高层次语义信息。模型采用基于卷积神经网络的空间感知模块,增强了对图像中人群分布位置的敏感性。本文提出的模型在标准数据集上进行了验证,实验结果表明:SDOAM模型能有效降低背景因素的干扰,减少计数误差。基于概率密度图的多尺度优化模型通过增强人群的分布位置信息能有效提高概率中间表示密度图的质量,并且在损失函数中对不同尺度预测密度图优化有利于提高模型的准确性和鲁棒性。
其他文献
作为测试系统参数,验证成像算法性能和分析干扰噪声的重要手段,SAR的回波仿真对SAR技术的研究有着至关重要的作用。针对SAR回波模拟方法设计,本文首先对SAR成像方法展开了分析。SAR回波模拟方法主要分为时域方法和频域方法。频域算法基于快速傅里叶变换的逆向处理,能够通过较低的运算量获得良好的分辨率性能。然而,频域方法通常需要满足方位向不变假设,因此频域方法的应用将受到平台构型的限制,无法适用于任意
学位
探地雷达(Ground penetrating radar,GPR)是利用天线发射和接收高频电磁波来探测介质内部物质特性和分布规律的一种地球物理方法,在工程勘察领域的应用日益广泛。在探地雷达反演中,信号中的强杂波严重影响了反演过程中地底目标成像的精度,并且传统反演方法大多数采用非线性迭代优化算法求解,面临着求解时间久、计算复杂度高和参数设置冗杂等问题。本文将以低秩稀疏分解理论为基础的杂波抑制与成像
学位
基于结构光条纹投影的成像系统因其无接触、高效率和高精度等优点,被广泛地运用于三维测量等计算成像领域。而结构光系统的非线性失真和光学畸变等因素降低了结构光三维测量的精度。本研究在结构光成像系统非线性模型的基础上,分析了各系统参数对展开相位估计精度的影响;提出了一种针对结构光三维测量系统空间几何畸变和光强非线性失真问题的预矫正方法;设计了一种实现结构光系统复合标定的快速方法。针对几何畸变和光强失真,建
学位
作为一门交叉学科,导航定位技术在地球科学、信息学科、智慧城市、物联网生活以及自动驾驶等方面发挥着越来越重要的作用。对于愈来愈复杂的现实场景以及定位需求,单一导航系统受自身的局限性影响,难以满足这些要求,组合导航随即成为导航定位研究的重点。组合导航将多种导航方法进行结合,通过组合手段抵消单一导航系统的不足,以此提高导航定位的精度以及性能。组合导航中的目标状态估计问题大多都是非线性滤波问题,常见的非线
学位
得益于无人机的低成本和灵活移动性,无人机已经被应用于各类复杂通信场景。传统的无人机通信轨迹规划都是将问题进行人工数学建模后进行优化求解,常假设信道模型为简单的视距链路(Lo S)或者概率Lo S,获得关于无人机位置的函数表达式后,再用凸优化技术进行路径规划。由于信道的时变性和无人机的移动性,传统的建模和描述过于简单,获得的轨迹无法指导无人机的实际应用。深度强化学习是一种在复杂的动态环境中进行最优决
学位
虚拟手术仿真系统可以对低年资医生进行临床手术培训,也可以针对病理进行术前手术预演,因此具有重要的研究价值。针对肾脏模型表面存在的黑空洞区域问题,论文提出了基于点云密度的修补方法,使得模型更加完整。后续针对传统球冠映射方法运用于不规则模型表面出现纹理映射模糊和重叠问题,提出基于区域划分球冠映射算法改善了模型表面的纹理效果。针对传统切割方法存在狭长状的切口问题,论文利用三阶贝塞尔曲线对不同切割情况的手
学位
在实际生活中,目标说话人的语音会被其他说话人的语音干扰。利用干扰后的说话人语音进行说话人确认时,说话人确认系统的性能会大幅下降。因此,多说话人语音的说话人确认工作包括两部分:对目标说话人语音进行提取和对提取出来的语音进行说话人身份的确认。本文主要研究基于深度学习的多说话人语音的说话人提取和确认方法,主要研究工作如下:(1)提出一种基于深度学习的注册说话人模型的说话人确认方法。该方法分别为每个注册说
学位
随着人们对地球以至于宇宙太空的探索,遥感技术得到很好的发展。无人机机载微波辐射计是微波遥感技术不可或缺的设备。早期微波辐射计的天线扫描依赖机械运动,扫描过程中机械振动带来的误差对设备测量精确度产生影响。随着漏波天线的提出,出现了一条解决该问题的全新技术路线。漏波天线是一类以行波传播,沿传播结构不断泄漏能量的天线,可产生窄波束,具有馈电结构简单、高定向性、低剖面等优点。其具有的频率扫描特性使得波束方
学位
随着时代的发展,我们对于人机交互方式的要求逐渐提高,在传统的精确性基础上不断追求自然性和舒适性。手势是人与生俱来的交互方式之一,它拥有极强的直观性,这使得基于手势识别的人机交互应用越来越热门,手势识别同样也在手语翻译、医疗辅助系统和手势操作等各方面得到了广泛应用。本文基于手势的三维骨骼信息对静态和动态两种手势识别问题展开了探讨,具体研究内容如下:首先,提出了基于肤色信息和深度信息的静态手势识别方法
学位
为了解决遥操作系统中由于时延与扰动带来的不稳定问题,本文设计了一种连续快速非奇异终端滑模控制与动态补偿切换滤波器相结合的控制算法,使得遥操作机器人系统在有界时延与扰动的情况下快速且稳定地实现轨迹跟踪,具有较好的收敛性与鲁棒性。首先,采用了指数积法对主从端机器人进行运动学建模,并根据拉格朗日法对主从端机器人进行了动力学建模,为接下来遥操作机器人系统控制算法的设计奠定了基础。其次,为了解决传统滑模控制
学位