论文部分内容阅读
近年来,使用数字化方式对传统文化资源进行记录和保护已经成为重要的研究课题。类似于音乐中的五线谱能够记录编曲,拉班舞谱可以对人体动作进行记录。拉班舞谱是世界上使用最广泛的一种科学、符号化的舞蹈记录体系,但手工记谱需要耗费大量的时间和精力,因此研究采用计算机技术自动生成拉班舞谱十分必要。
本文主要工作是研究基于动作捕捉数据的拉班舞谱自动生成的高效算法。首先根据人体运动的特点,设计符合人体拓扑结构的骨骼特征;然后通过分析人体上下肢动作在舞谱记谱方式上的不同,首次提出高效的深度学习算法对人体上下肢动作进行识别,最后将设计的特征以及上下肢动作识别算法融入到舞谱自动生成平台中,实现一个端到端的从运动捕捉数据到拉班舞谱的自动生成系统。主要创新工作总结如下:
(1)通过分析人体运动特点,提出了一种符合人体拓扑结构的骨骼节点向量特征。首先将以欧拉角形式存储的BVH运动捕捉数据转换为世界坐标系下的三维人体空间数据,然后将人体各部位相邻的关节节点进行连接,形成骨骼向量特征,这样的特征更具鲁棒性与判别力,能更好的表示人体动作的空间位置和方向。
(2)通过对人体上肢动作在拉班舞谱中记谱方式的分析,提出了一种基于极限学习的上肢姿态识别算法。该算法可以比较快速且高效的用于拉班舞谱中上肢动作的生成。上肢动作在拉班舞谱的记谱方式中主要关注动作最后的姿态,不用关注前后之间的关系,提出的基于极限学习的识别算法可以非常高效的对上肢动作进行分类和识别。
(3)通过对人体下肢动作在拉班舞谱中记谱方式的分析,提出了一种基于长短时记忆神经网络(LSTM)与卷积神经网络(ConvNet)的多层联合网络模型下肢动作识别算法。下肢动作在拉班舞谱的记谱方式中关注动作的动态变化过程,LSTM的自连接网络结构使得它在处理动态变化的时序数据具有天然的优势,而ConvNet非常善于学习动作的空间信息,本文提出将LSTM模型与CNN模型进行融合,使这两者可以相互补充,达到更加准确的识别效果。
(4)在上述提出的新特征以及新方法的基础上,设计和实现了一个端到端的从运动捕捉数据到拉班舞谱的自动生成系统。系统的输入是通过运动捕捉设备获取得到的表演人员的运动捕捉数据,然后经过上述新特征的提取以及新方法对人体动作的识别,即可在几秒的时间内自动绘制拉班舞谱并生成文件保存到本地,实现了计算机技术与拉班舞谱的完美结合。
本文主要工作是研究基于动作捕捉数据的拉班舞谱自动生成的高效算法。首先根据人体运动的特点,设计符合人体拓扑结构的骨骼特征;然后通过分析人体上下肢动作在舞谱记谱方式上的不同,首次提出高效的深度学习算法对人体上下肢动作进行识别,最后将设计的特征以及上下肢动作识别算法融入到舞谱自动生成平台中,实现一个端到端的从运动捕捉数据到拉班舞谱的自动生成系统。主要创新工作总结如下:
(1)通过分析人体运动特点,提出了一种符合人体拓扑结构的骨骼节点向量特征。首先将以欧拉角形式存储的BVH运动捕捉数据转换为世界坐标系下的三维人体空间数据,然后将人体各部位相邻的关节节点进行连接,形成骨骼向量特征,这样的特征更具鲁棒性与判别力,能更好的表示人体动作的空间位置和方向。
(2)通过对人体上肢动作在拉班舞谱中记谱方式的分析,提出了一种基于极限学习的上肢姿态识别算法。该算法可以比较快速且高效的用于拉班舞谱中上肢动作的生成。上肢动作在拉班舞谱的记谱方式中主要关注动作最后的姿态,不用关注前后之间的关系,提出的基于极限学习的识别算法可以非常高效的对上肢动作进行分类和识别。
(3)通过对人体下肢动作在拉班舞谱中记谱方式的分析,提出了一种基于长短时记忆神经网络(LSTM)与卷积神经网络(ConvNet)的多层联合网络模型下肢动作识别算法。下肢动作在拉班舞谱的记谱方式中关注动作的动态变化过程,LSTM的自连接网络结构使得它在处理动态变化的时序数据具有天然的优势,而ConvNet非常善于学习动作的空间信息,本文提出将LSTM模型与CNN模型进行融合,使这两者可以相互补充,达到更加准确的识别效果。
(4)在上述提出的新特征以及新方法的基础上,设计和实现了一个端到端的从运动捕捉数据到拉班舞谱的自动生成系统。系统的输入是通过运动捕捉设备获取得到的表演人员的运动捕捉数据,然后经过上述新特征的提取以及新方法对人体动作的识别,即可在几秒的时间内自动绘制拉班舞谱并生成文件保存到本地,实现了计算机技术与拉班舞谱的完美结合。