【摘 要】
:
手势是人机交互中的一个非常重要的手段。由于近些年来人工智能、增强现实和虚拟现实技术的迅猛发展以及深度相机的普及,实时并且准确的手势姿态估计成为了人工智能研究领域
论文部分内容阅读
手势是人机交互中的一个非常重要的手段。由于近些年来人工智能、增强现实和虚拟现实技术的迅猛发展以及深度相机的普及,实时并且准确的手势姿态估计成为了人工智能研究领域的一大热点研究问题,它可以在我们的日常生活中发挥重要的作用,计算机视觉为手势姿态估计领域的研究与发展提供了一种全新的更好的思路,3D手势姿态估计也是计算机视觉中的一个非常有挑战性的任务。最近几年,卷积神经网络在计算机视觉领域中获得了非常广泛的应用并且取得了巨大成功,同时在当前互联网高速发展的推动下,各种新的大型公共标准数据集不断出现,极大的推动了卷积神经网络在手部姿态估计领域的发展。针对目前手部姿态估计领域存在目标场景复杂、人手自由度高等问题,本文设计了一个基于注意力机制的卷积神经网络结构的3D手势姿态估计回归模型,主要研究工作如下:为了解决复杂场景下的背景对手势姿态估计产生影响这个问题,本文根据深度值信息把包含人手部分的深度图像从场景比较复杂的深度图像中精确分割出来;为了避免目标和相机平面之间的距离不一致而影响手部姿态估计精确度,对深度图像做归一化处理。同时为了定位出感兴趣的区域,设计了一个基于注意力机制的卷积神经网络结构来解决手势姿态估计问题。为了使卷积神经网络模型训练得更快,对groundtruth(标注)应用主成分分析法进行了降维处理,这样就极大地减少了卷积神经网络中全连接层的参数,也相当于对手部姿态添加了一定的姿态约束,并且还对heatmap(热力图)损失的有效性进行了对比实验。本文的实验结果表明,heatmap损失能提高我们提出的神经网络模型的泛化性能,而且基于注意力机制的卷积神经网络模型在三个公共标准数据集上达到了比较好的性能,证明了我们提出的方法的有效性和优越性。
其他文献
随着无线网络的快速发展和覆盖规模的不断扩大,无线网络应用日益多样化,例如网页搜索、IPTV、视频电话、在线游戏、网络购物和直播等,导致用户对无线网络带宽资源的需求越来
煤炭是我国最主要的一次能源,煤矿生产安全是煤炭行业健康发展的保障。煤矿井下作业点多、线长、面广,工作环境复杂,人员、设备管理十分困难,极易出现安全事故。目前煤矿装备的人员定位系统,多采用区间定位法,定位精度低,已经不能满足煤矿对人员、设备精确管理和抢险救灾的需求,因此研制新一代煤矿人员与设备精确定位系统成为亟待解决的问题。超宽带(Ultra Wide Band,UWB)技术凭借其独特的无载波通信,
特定动态目标识别与跟踪在视频监视等方面具有重要的应用,近年机器学习技术以及卷积神经网路的发展极大地推动了特征提取以及图像的模式识别技术发展。本课题主要基于卷积神
我国经济面临高速发展向高质量发展的转型期,实现经济可持续发展关键是要发展创新。创新要素集聚是区域创新能力提高的关键因素,有利于增强国家自主创新能力和国际竞争。呼包
近年来,数字化信息爆炸式增长,如何高效快速采集、处理、分析有效信息成为社会关注热点。人工神经网络凭借强大的数据处理能力成为众多学者研究的对象。与此同时,各种机器学
中国同英语国家交流日益密切,随着生成语法的发展,关于空论元已有广泛研究。包含空主语和空宾语,空论元指的是那些没有语音表现形式但有语法作用和语义内容的动词论元。本研究旨在研究空论元的习失,对不同类型空论元进行对比分析,并考察影响空论元习失的一些因素。在普遍语法的原则与参数理论框架下,本研究通过采用语法判断测试和写作任务,考察和分析了以英语为外语的154名中国大学生的空主语和空宾语习失情况。结果发现和
2018年,中国电子学会把胶囊网络列为人工智能的十大成长性技术之一。胶囊网络是一种全新的深度学习方法,由“深度学习之父”—Geoffrey Hinton于2017年10月提出。胶囊网络,这
SLAM(Simultaneous Localization and Mapping,实时定位和制图研究)是机器人和场景理解中非常重要的研究方向,并且在定位导航领域起着重要作用。近年来由于双目相机的成本较
在配位化学领域中,salamo型配体相比于经典的salen型配体具有更好的灵活性与稳定性,这是因为引入了电负性比较强的O原子,使其在化学反应过程中难发生水解反应和交换反应,从而
姿态控制系统是保证卫星在轨期间能否具有高水平控制性能的关键。随着科技发展和社会进步,人类对卫星的要求任务越来越多样化,这会导致卫星的结构趋于复杂化。结构的复杂化会