基于深度时空特征挖掘的人体骨骼数据建模与姿态过渡技术研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户:jzy0403
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自运动捕捉技术的问世,便对当时的动画制作及现在的电影制作、虚拟现实、机器人控制、医疗健康等各方面产生了深远的影响。人工智能时代的到来,自动驾驶汽车、服务型智能机器人等需要具备一定的行为交互能力,人体运动的动作预测提前感知潜在的动作,以提供无缝的交互体验。在动画创作、电影特效制作中,为充分利用运动序列,将短时、单一语义的序列片段,将其平滑过渡拼接成一个长时的具有特殊含义的运动序列。针对以上两类问题,本文聚焦于深度学习,建立神经网络预测模型、双向预测融合模型两个方面的内容,研究成果分别如下:(1)基于注意力机制的神经网络预测模型:人体骨骼运动数据是在时间域上连续的序列,而LSTM非常适合处理时间序列的数据,不同的是在每个循环神经单元前构建注意力层。每个时间步的运动帧首先经由注意力层分配单帧中的每个关节点注意力权重,提取运动序列中的明显或隐含的特征,再由循环神经单元堆叠运动帧在时间域上的特征。为提升模型性能,在解码器部分添加残差连接。实验结果表明所搭建的网络模型对人体运动预测任务有着杰出的预测性能。(2)基于图卷积的神经网络预测模型:人的运动在时间和空间上都保持连续性,而上一个工作忽略了人体运动的空间特征。因此在这个工作中创建图卷积层,将人体17个关节点分别在图卷积层中计算与其邻居节点的空间关系。在进行时循环神经单元每往前推进一个时间步,均进行图卷积操作,从而达到同时提取运动序列在时间域和空间域上的运动特征的目的,提高模型的预测性能。(3)人体运动序列的双向预测融合模型:针对人体运动序列拼接的任务,提出了构建双向预测融合模型。由于序列预测模型的性能随着预测时长的增加预测误差越来越大,预测帧则依据与真实运动序列的最后一帧的时间距离给予分配大小不同的权重系数。在序列融合阶段提出加权平均融合法,并结合每个预测帧的权重系数,对拼接过渡段的序列进行平滑操作。
其他文献
数据挖掘(Data Mining)是当前数据库和信息决策领域的前沿研究方向之一,top-rank-k频繁模式挖掘是数据挖掘中挖掘rank不大于k的频繁模式的方法,可以解决传统频繁模式挖掘支持
闪存作为一种主流的非易失性存储器,具有低耗能、可靠性良好、高密度存储等优势。然而,随着闪存存储密度的不断增加以及闪存芯片封装尺寸逐渐缩小,闪存存储数据的可靠性面临
有机-无机杂化钙钛矿作为一种性能优异的半导体材料,本身具有高载流子迁移率、高吸收系数、长的载流子寿命以及可调控的带隙等优点,近年来受到各界的广泛关注。在目前研究中,
随着列车运行速度的持续提升,对于安全方面的要求越来越高,其中,列车定位的精确性和可靠性是保证列车高速运行的关键。论文综合考虑列车定位所需求的实时性、高精度和不受外
差分进化算法是一种基于种群差异的进化算法,通过种群内个体间的合作与竞争来实现对优化问题的求解。对于单目标连续优化问题,差分进化算法有其自身的优势。然而,DE算法也存
环境问题日益严重并引起社会关注,光催化技术是一种降解有机污染物的有效方法。TiO2成本低、稳定性强且表现较高的光催化性能,因此受到研究者的关注,但由于TiO2带隙较宽(3.2 e
目前,许多建筑施工企业已经通过了ISO9000质量体系认证,有的已经通过了儿次监督审核。但是,由于部分企业对统汁技术在过程控制利质量改进中的作用重视不够,加上许多认让机构
会议
玻璃制品是一种市场需求量较大的日常用品,对一些常用的玻璃制品进行分类回收及循环利用能够缓减玻璃制品的供给压力,减少其在制造环节中产生的资源消耗以及环境污染,达到节
P2P网贷作为一种创新型互联网金融模式,凭借信息技术优势突破时间和空间的限制,扩大了金融服务覆盖面,增强了金融服务效率,成为传统金融的有效补充,本身具有普惠特性。但在行
小型无人机等飞行器的出现和迅猛发展,给空域监测和管控带来困难。雷达能在远距离大范围搜索目标,是无人机探测的重要手段之一。由于无人机目标运动速度低、雷达散射截面积较