【摘 要】
:
手势识别是人机交互的一个重要研究方向,在体感游戏、智能家居等场景有着广泛应用。日常交互手势识别存在手势形变、背景复杂等问题,伴随着手势识别广泛应用,人们对于手势识别的便捷性、准确性提出了更高要求。凭借视频采集便捷的优势,手势识别研究多基于视觉展开,静态手势和动态手势是手势识别的两个主要研究内容,静态手势识别针对单帧图片研究,动态手势识别针对多帧图片研究。本文在深度学习的框架下,基于真实场景分别对静
【基金项目】
:
国家重点研发计划智能机器人专项子课题(2019YFB1312102); 河北省自然科学基金(F2019202364);
论文部分内容阅读
手势识别是人机交互的一个重要研究方向,在体感游戏、智能家居等场景有着广泛应用。日常交互手势识别存在手势形变、背景复杂等问题,伴随着手势识别广泛应用,人们对于手势识别的便捷性、准确性提出了更高要求。凭借视频采集便捷的优势,手势识别研究多基于视觉展开,静态手势和动态手势是手势识别的两个主要研究内容,静态手势识别针对单帧图片研究,动态手势识别针对多帧图片研究。本文在深度学习的框架下,基于真实场景分别对静态手势和动态手势进行分析,探索基于视觉的手势识别新方法。(1)基于注意力机制与特征融合的静态手势识别研究卷积神经网络在手势识别领域有着越来越多的应用。但现有卷积神经网络存在特征表征不足问题,影响手势识别精度。为此,提出一种基于注意力机制与特征融合的轻量级静态手势识别算法r-mobilenetv2。该算法首先将通道注意力和空间注意力串联起来,将二者输出特征图通过跳跃连接得到一种全新注意力机制,即自适应卷积注意力机制(Adaptive Convolution Attention Module,ACAM)。然后将高层特征经上采样与低层特征空间维度匹配,低层特征使用一维卷积调整通道维度与高层特征通道维度匹配,二者线性相加,其结果经卷积操作与高层特征按通道维度连接,实现提出的分类特征金字塔(Classification Feature Pyramid,CFP)。最后,将提出的ACAM和CFP结合,用于改进的Mobile Net V2中,得到r-mobilenetv2网络。将提出的ACAM加载到不同模型上,验证ACAM的适用性,对比加载不同注意力机制的实验结果,验证ACAM的有效性,然后进行消融实验,综合验证ACAM与CFP的有效性。实验显示r-mobilenetv2相较Mobile Net V2减少27%参数量,错误率降低1.82%。(2)基于多模态融合的动态手势识别研究针对复杂环境下动态手势识别精度低且鲁棒性不强问题,提出一种基于多模态融合的动态手势识别算法TF-MG(Two Flow Network Mobile Net V2 and Deep GRU)。TFMG结合深度信息和三维手部骨架信息,采用双流网络利用两种不同模型分别提取特征信息,然后将提取的特征融合送入分类网络,实现动态手势识别。针对含有深度信息的视频帧序列运用运动历史图像方法提取运动轨迹,进而使用Mobile Net V2提取特征。针对三维手部骨架信息时序序列,采用Deep GRU(Deep Gated Recurrent Unit)对三维手部骨架信息提取特征。实验结果表明,TF-MG在DHG14/28数据集上,取14类手势识别精度达到93.29%,取28类手势识别精度达到92.25%。与其他方法对比中,实现了更高的识别精度。(3)基于三维卷积神经网络的动态手势识别研究三维卷积神经网络参数量较二维卷积神经网络巨增,且训练时间长,为提高三维卷积神经网络效率,提出一种基于三维卷积神经网络的动态手势识别算法Action-3D。相较传统三维卷积,将三维卷积核在空间域和时间域上分解,分解的卷积核间加入Re LU激活函数,提升网络非线性表达能力。此外,借鉴Inception思想拓宽网络,结合三维卷积分解提出Inception-3D模块。Action-3D在自建数据集上精度达96.8%,通过与其他优秀网络对比,Action-3D在更少参数量的情况下,取得更高的识别精度。
其他文献
面对快速城镇化和城市人口激增的现实,人民日益增长的美好生活需要和城市高质量内涵发展的新时代目标都促使城市居民对高品质健康住房的需求持续快速增加。在新时代共享经济、互联网经济、生产服务社会化背景下,城市居民居住行为发生转变,居民对住宅使用性能、空间灵活度和健康品质等方面有了新认识、产生了新需求。然而大量建成的既有小户型居住空间普遍存在空间适应性不强、居住性能品质不佳、室内空间效率不高、缺乏精细化设计
“错误出生”是指,由于医方的过失,接受医疗服务的父母丧失了选择是否终止妊娠的权利,产下带有严重“缺陷”的孩子。实践中,因“错误出生”产生了大量的诉讼,学界称为“错误出生”诉讼。此类诉讼源于美国,后在世界范围内广泛出现。自“错误出生”诉讼出现至今,学界与司法实务界对其的争论便从未停止。随着产前检测技术水平的不断发展进步,人们已然能够通过多种检测手段发现胎儿可能存在的诸多“缺陷”,但“错误出生”诉讼并
随着绿色建筑技术的发展,人们对舒适、健康的天然光环境愈加重视。采用更合理的评价指标指导建筑采光设计对绿色建筑的发展具有重要意义。现有天然采光评价方法中,传统的采光系数指标存在忽视天空状况真实变化,无法纳入朝向、时间、季节等因素的缺陷。近年来该领域引入动态天空模型,运用动态采光评价指标进行办公建筑天然光环境研究,显示出综合全年光气候特征所具有的优势。但在高层住宅建筑室内空间的天然采光评价中,其应用方
企业税收不确定性反映了企业在现行税收政策和制度下的纳税遵从成本。在数字经济强势发展的背景下,本文研究数字经济发展是否有效降低了企业税收不确定性。以2013~2020年我国沪深A股上市公司为样本,实证研究发现:(1)数字经济发展能够降低企业税收不确定性;(2)数字经济发展通过提升企业会计信息透明度、提高税收征管效率、改善地区营商环境降低企业税收不确定性;(3)异质性分析表明数字经济发展对企业税收不确
为了应对日益严峻的城市老龄化问题,社区养老服务逐渐成为我国养老产业的发展重心。嵌入式养老模式作为社区养老服务体系中的补充环节,为解决社区养老问题提供了新思路。然而当前许多嵌入式养老设施在更新设计过程中,普遍存在与既有社区融合性差而导致邻避效应严重、既有结构导致适老化设计受限等问题,不利于社区养老设施的建设。因此,亟需探明嵌入式养老设施更新设计的需求特征与影响因素,以满足当前社区养老服务建设需求。论
目前世界范围内频发的自然灾害给法律制度带来了无与伦比的挑战,影响着整个世界。国际救灾法还是新兴的法律领域,有关的中文译文较少,为了让中国法学学者了解国际救灾法研究的现状,本翻译项目选取David D.Caron,Michael J.Kelly和Anastasia Telesetsky主编的《国际救灾法》一书作为源语文本。该书是一本介绍与跨国救灾有关的国际法的法学著作。本文是基于《国际救灾法》第一章
当前,随着国家经济结构的不断转型和快速发展,审计在经济发展中承担的角色也越来越多,同时国家和社会的发展也需要审计机关提供更加完善的审计服务。《关于实行审计全覆盖的实施意见》于2015年12月出台后,明确提出了“审计全覆盖”的概念。结合近年来我国对外投资不断扩大,当前我国的国有企业境外投资风险,已经成为中国经济“走出去战略”所面临的最大问题。因此防范和化解国有企业境外投资风险,已经成为我国进一步扩大
在建筑工程领域中,业主单位拖延支付工程款的情况屡见不鲜,承包方为分散业主单位的支付风险,常会在分包合同中设置“背靠背”条款。例如,承包方在业主单位支付工程款之后,才有义务向分包方支付工程款,若业主单位未支付相关工程款,则分包方无权请求承包方支付工程款。近年来,建工领域“背靠背”条款相关案件越来越多,但由于法律并未对“背靠背”条款的法律效力或相关处理规则进行规定,审判实务机关对“背靠背”条款法律效力
再审撤回起诉,是指再审裁判宣告前,原告向再审法院撤回原审起诉,不再要求人民法院进行审理从而终结全部诉讼程序的行为。再审撤回起诉制度作为我国民事撤诉体系中的一部分,应当遵循民事撤诉制度基本原理,即尊重当事人对其程序权利的处分。但再审程序作为有别于一般救济程序的救济渠道,其具有理论独立性与适用谦抑性。具体而言,在允许原审原告再审程序中撤回起诉的前提下,于具体的程序运行中收紧再审撤回起诉制度的限制条件,
近年来,百皮秒激光脉冲在激光惯性约束聚变(ICF)、激光等离子体的产生、激光医疗等诸多方面都得到了重要应用。受激布里渊散射(SBS)脉冲压缩技术是一种高效的实现高峰值功率百皮秒激光脉冲输出的方式。传统的SBS由热噪声起源,存在压缩脉冲输出不稳定、光路复杂等缺点。自泵浦SBS起源于窗镜反馈,其产生的压缩脉冲的时间、位置稳定性极高。因此,本研究基于自泵浦SBS脉冲压缩的诸多优点,分别在理论上和实验上探