自然场景下人体姿态估计方法的研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:t739155593
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着深度卷积神经网络在计算机视觉领域上的显著性进步,特别是通过卷积神经网络进行人体姿态估计取得了较好的效果,同时图像处理领域也取得了明显的进步。自然场景下采集的图像可能含各种噪音(像雾气、雨滴、以及高斯白噪声等)的干扰,严重的影响了图像中人物的可观测性。本文主要对图像处理领域的图像去雾、图像去噪和高级计算机视觉中的人体姿态估计三个方面进行了研究。针对大多数图像去雾算法模型参数估计准确性差及色彩失真等问题,提出了一种端到端的密集连接扩张卷积神经网络。首先,通过使用多层密集连接结构来增加网络的特征利用率,避免网络加深时的梯度消失现象。其次,通过在密集块中使用不同扩张率的扩张卷积,使网络在充分聚合上下文特征信息时不损失空间分辨率,并避免了网格伪影的产生。最后,为了提高算法的去雾能力,我们将该网络划分为多个阶段,并在每个阶段引入侧输出模块,从而获得更精确的特征信息。实验结果表明,所提出的去雾算法无论是在合成数据集上还是在真实数据集上都取得了较好的去雾效果,恢复的色彩更接近无雾图像,并且定量评价指标峰值信噪比(PSNR)和结构相似性(SSIM)均优于其他对比方法。针对数字图像采集过程中产生噪音影响及盲去噪的鲁棒性问题,提出一种高密度连接的残差密集连接扩张卷积神经网络。该网络以残差密集扩张模块为网络的主干,首先通过使用不同大小的扩张率增强感受野,提高空间上下文特征信息的利用率。其次,采取密集连接的形式,从浅层中就开始保证了提取出来特征的真实性。最后,在使用密集连接结构的同时引入残差思想,进一步的提高网络各层提取特征信息的有效性和真实性。为了进一步的提升网络的性能,利用浅层中的底层特征信息进行辅助训练,提高网络在未知噪音上的处理能力。实验结果表明,所提出的去噪网络在BSD68和Set12数据集上的峰值信噪比均优于其他对比方法,且在未知噪音水平的情况下也达到了较优的结果。针对当前的大多数人体姿态估计算法主要是在网结构上进行一定程度的变化,忽略注意力机制的积极作用及存在噪音的影响。本文通过采用Simple Baseline网络为基本框架,并向其中Resnet-50网络的瓶颈结构(Bottleneck)里添加注意力,分别使用Bottleneck+SE和Bottleneck+CBAM两种注意力瓶颈结构作为网络基础结构。通过在网络的每一个瓶颈结构不断修正特征图的权值,从而不断的提升人体姿态估计网络的识别效果。实验结果表明,所改进的人体姿态估计网络在COCO和MPII两个标准的人体姿态估计数据集上的识别效果均优于其他对比方法。
其他文献
舰载雷达是一种可以远距离获取非合作运动目标高分辨率图像的雷达。距离向分辨率来源于雷达发射的宽带信号,方位向分辨率来源于雷达与目标间相对运动产生的多普勒带宽。随着雷达成像技术的发展,雷达二维图像已经无法满足某些特定应用的需求,对雷达三维图像的需求不断增加。舰载雷达随海浪进行三维的摆动,对运动目标进行成像时,其回波信号存在着高阶相位项,这些高阶相位项存在着目标高度向的信息。若采用传统的ISAR成像算法
在资本市场不存在缺陷和公司内部代理成本为零时,企业可能会达到使企业价值最大化的投资水平。然而在信息不对称和企业代理冲突的存在下,企业往往会出现投资效率低下等问题。
核心观点:解决乡村教学点教育问题,除了培养全科教师,还应重拾并改造使用复式教学;在农村小学全科教师培养的过程中,要注重对这批定向免费师范生创新使用复式教学技能的训练
会议
随着第四代移动通信的飞速发展,国内4G用户数量快速增加,4G已经渗透到人民群众生活和国家生产的各个方面,并将对国家与社会公共安全带来巨大的影响。目前国内外针对4G安全的研究偏向于理论方面,即使是在实践方面的研究也主要以接入网为主,而针对核心网的工程实践研究相对较少。通过对4G核心网模型和S1AP协议的分析,我们可以尝试找到一种有效的面向4G核心网协议的安全检测方法。首先,本文对LTE核心网的网络架
在雷达信号处理领域中,目标跟踪是非常重要的组成部分。目标跟踪技术通过传感器的相关量测值获得感兴趣目标的状态信息,并通过适当的滤波算法实现对目标运动状态的预测与估计,进而达到稳定跟踪的目的。其中,滤波算法的选择对跟踪结果的准确度起着决定性作用。因此,本文首先研究了线性场景与非线性场景下不同滤波算法的跟踪性能,分析了各自的优缺点。其次,为了获得更高的目标跟踪精度,本文又研究了多传感器信息融合算法,包括
白桦茸一直是俄罗斯民间治疗与防治不同疾病的食药用菌,美国、日本、韩国及欧盟国家已经增加了对其研究力度。近年来越来越多中国消费者对该真菌感兴趣,市场对它的潜在需求很
随着对地观测技术的迅速发展,卫星图像的数量显著增加,大量的卫星图像中所蕴含的有价值信息亟待挖掘利用。本文针对卫星图像进行场景分类,即将卫星图像划分为住宅区、植被区等。对卫星图像的场景分类,能够精确掌握地物覆盖变化,这些信息的获取能够协助相关部门治理环境、合理利用土地资源、规划城市发展等。卫星图像往往信息量丰富、背景复杂而且带有噪声,由于这些因素的影响,传统的基于中低级视觉特征的遥感卫星图像场景分类
化学发光(CL)是物质在进行化学反应过程中伴随的一种光辐射现象。即:在化学反应过程中,化学能转化为光能,以光子的形式释放出来。与其他光学方法相比,化学发光不需要激发光源,具有灵敏度高、线性范围宽、且仪器操作简单等优点。根据CL的发光时间长短,可以将化学发光反应分为闪光型和辉光型。而目前,大多数的化学发光体系为闪光型,这也在一定程度上限制了其在生物成像以及冷光源等领域的广泛应用。因此,探究高强度、长
5G通信技术的面世为多样化的物联网络带来前所未有的发展契机,诸多万物互联元素从概念畅想变为现实,与此同时,海量智能设备入网,物联网应用分析数据的增长趋也势持续攀升。当前,云计算服务于物联网已成为主流趋势,一定程度上解决了物联网应用中高性能业务计算与海量分析数据存储的难题。然而,在5G赋能下充斥物联设备数据的未来,快速、可靠的业务处理变得至关重要,云计算面对特殊业务时仍存在业务响应高延迟、通信资源有
公共政策会随着社会的发展而变化,政策变迁表现为政策的补充、调整或终止以及新的政策的执行,政策变迁受到制度、行动者、环境等动力因素影响。因此,政策变迁是政策研究的重要内容,通过对政策变迁过程进行研究可以揭示政策变迁的动力因素变迁规律等。研究基于约翰.W.金登的多源流理论,采用文献研究法、调查研究法对温州市妇女产假政策的变迁过程进行分析,深入探讨各次变迁动力,寻找温州市妇女产假政策变迁的动力因素,并尝