【摘 要】
:
随着计算机视觉技术和相关硬件设备的不断发展,人体姿态识别已逐渐走进人类生活,被广泛应用于视频监控、运动辅助分析、家居养老、体感游戏等各个领域,具有十分可观的经济价值和社会价值。传统的人工设计特征方法需要研究人员有丰富的经验,工作量大,鲁棒性较差,逐步兴起的深度学习方法可以自动学习动作特征并进行识别,能够很好解决这一问题。但是由于背景复杂、动作多变、目标存在遮挡和光照等因素的存在,人体姿态识别在实际
论文部分内容阅读
随着计算机视觉技术和相关硬件设备的不断发展,人体姿态识别已逐渐走进人类生活,被广泛应用于视频监控、运动辅助分析、家居养老、体感游戏等各个领域,具有十分可观的经济价值和社会价值。传统的人工设计特征方法需要研究人员有丰富的经验,工作量大,鲁棒性较差,逐步兴起的深度学习方法可以自动学习动作特征并进行识别,能够很好解决这一问题。但是由于背景复杂、动作多变、目标存在遮挡和光照等因素的存在,人体姿态识别在实际应用场景中仍有一定局限性。本文旨在通过构建新的卷积神经网络模型来提高人体姿态识别的准确率和算法鲁棒性,具体所作研究如下:(1)本文首先对五种运动目标检测方法进行分析研究,相较于其他几种检测算法,ViBe算法的检测清晰度和算法实时性较好,但在背景较复杂或目标动态性强的环境下,会出现目标边缘残缺、区域断层和内部空洞的问题。为了进一步提高检测完整度,本文提出了一种结合自定义评价函数自适应调整阈值的改进ViBe算法,实验结果表明,该改进算法可以为卷积神经网络模型的输入提供更为清晰的运动目标前景,有利于后续的姿态分类识别。(2)虽然三维卷积神经网络已逐渐应用在人体姿态识别领域,但是仍存在丢失目标运动信息,特征提取不完善,容易误检相似动作的问题,为了提取到更加丰富细致的动作特征,本文连续使用两次三维卷积操作,并通过BN算法和dropout技术防止可能由多次卷积导致的模型过拟合现象,在全连接层前添加一个空间金字塔池化层,使网络能够处理任何分辨率的图像,以提高算法适用性。最终本文构建了一个融合BN算法、dropout技术和空间金字塔池化技术的多卷积3D CNN模型。(3)本文在KTH、UCF101标准视频库和自建视频库上做识别测试实验,以不同的特征组合作为3D CNN模型的输入进行对比实验,并通过改进的ViBe算法得到清晰的目标二值图。实验结果表明,以“ViBe二值图+光流图+三帧差分图”特征组合作为模型输入,可以得到较高的识别准确率,尤其针对背景较复杂、动作种类多且差异性小的数据集,改善的效果更好。由此可见,本文构建的3D CNN模型能够有效提高人体姿态识别的准确率,具有较好的应用价值。
其他文献
在干旱区盐碱地胡杨林下利用植物种间正相互作用的邻体脱盐效应来解决盐碱环境下植被恢复的问题,有利于促进盐碱地资源的利用、改良和胡杨幼苗的更新复壮。胡杨(Populus euphratica)的形成和演化与土壤性质密切相关,由于胡杨在幼苗阶段对盐碱环境的适应能力较差,加上处于干旱半干旱的新疆塔里木河流域由于人为的长期不当利用和暖干化对该区影响强烈,土壤盐渍化呈现加剧趋势,这严重抑制了胡杨的更新复壮。为
随着工业革命后世界各国工业化的发展,能源的需求量不断增加,使得以CO2为代表的温室气体超量排放,在此背景下CCS(碳捕集与封存)技术应运而生,越来越被重视。在CO2以液态形式长距离运输的过程中,由于压力、温度的变化,一部分CO2会转换成气态,从而以气液两相流的形式存在。为了准确得到管道内的流体状态,保证运输安全,管道内流体的质量流量和气体体积分数的实时监控测量至关重要。参考相关文献,了解国内外对C
近年来,以钛为基底生长的TiO2纳米管(TNT)由于其晶粒边界少、表面积与体积比值高,是一种优良的膜电极材料,因此受到了科学家们广泛的关注。而光电催化技术是近年来兴起的一门
该翻译报告主要讨论了在文本类型理论指导下对翻译策略和翻译方法的选择。《走向东方》记录的是纳撒尼尔同他的外国朋友罗伊·鲍德里奇游玩东方国家的所见所闻。译者翻译的部
功能翻译理论认为翻译是一项有目的行为,它使得因语言文化障碍无法进行的交际行为通过译员得以顺利进行。自1987年该理论被介绍到中国以来,其核心思想有助于译者们更深入的了
自20世纪90年代Iijima发现碳纳米管(CNTs)以来,一维纳米材料(如纳米管、纳米线、纳米棒和纳米带)因其独特的形貌及新颖的物理化学性质引起了人们的广泛关注。特别是近年来,一
众所周知,地下隧道周围的岩石由于破裂、膨胀、蠕变和风化等过程的联合作用而导致岩石性质的逐渐变化,表现出与时间相关的特性。因此研究地下隧洞围岩与衬砌的流变性质,具有重要的理论意义和工程使用价值。本文基于平面弹性复变函数方法,考虑支护滞后效应和隧洞内水压力,以广义Kelvin黏弹模型模拟岩体,将解析函数系数看作时间函数,通过黏弹力学中的对应原理推导出隧洞围岩与衬砌在完全接触条件下的黏弹解析解。在求解时
影响半导体光催化剂反应活性的主要因素是表面原子结构。表面原子结构决定了反应物分子的吸附、光生电子的表面迁移及产物的脱附等,而表面原子的排列和配位又随着晶面的不同
在过去的几十年里,均相金催化化学得到了大家的高度重视。这是因为阳离子金催化剂可以充当π路易斯酸活化不同类型的不饱和碳碳键。最近,一系列有用的合成方法已经被发展起来
森林冠层总面积指数(Plant Area Index,PAI)可广泛应用于林业、遥感、农学等领域,但目前采用传统光学方法精确测量森林冠层总面积指数仍十分困难。与传统方法相比,激光雷达方