论文部分内容阅读
人体运动捕获数据是一种新型的多媒体数据,在电影、游戏、机器人等领域都得到了广泛的应用。该数据在每一个捕获时间点记录人体所有关节的朝向或位置,形成一个运动帧序列。专业的运动捕获设备能够获取高精度、高逼真度的运动数据,但其价格十分昂贵,普及度差。运动重用技术能够利用已捕获到的运动数据,通过分析和建模生成满足用户需求的新数据,有效降低了使用运动捕获数据的时间、金钱和人力成本,因而受到了广泛的关注,已经成为了一项十分热门的研究课题。运动数据在捕获后通常会经过运动恢复及去噪、运动分割、运动压缩及关键帧提取、运动存储等处理过程,这些必不可少的处理过程对最后的运动合成与重用都具有重要的意义。早期的方法从运动学和图形学角度进行研究,缺乏对运动数据特性的有效建模,近年来,许多研究者开始将机器学习的一些方法运用在人体运动捕获数据的分析与重用上,但人体运动数据是一种非线性、强结构性的时序数据,直接使用机器学习算法效果有限,因此如何结合运动数据独有的结构特征与时空特性,从机器学习的角度对人体运动捕获数据进行建模是本学位论文的主要关注点。本学位论文从机器学习的角度,针对运动数据的特性对其建模,为运动恢复、运动分割两个任务设计了适用于运动捕获数据的机器学习算法。本学位论文的主要工作和创新成果可以总结如下:(1)提出了一种基于非凸截断schatten-p范数和运动学约束的人体运动恢复方法。所提出的算法利用了数据本身的低秩属性,解决了目前多数基于学习的人体运动恢复方法中存在的out-of-sample问题。现有的基于低秩矩阵恢复框架的人体运动恢复算法都采用了凸的核范数作为秩的代替函数,为了更好地对低秩属性进行建模,本文提出了一种基于非凸低秩矩阵恢复的人体运动恢复方法,其中本文利用了现有最好的非凸截断schatten-p范数来近似秩。其次,为了保持人体运动的时空特性和结构特征,本文在目标函数中还加入了骨段长度约束和平滑约束。平滑约束可以有效地保持人体运动的时空稳定性,避免相邻运动帧之间关节坐标的抖动,骨段长度约束可以有效地避免恢复结果中的骨长不合理问题,这两个约束对于得到高质量的恢复结果至关重要。本文提出的方法是第一个在低秩矩阵恢复的框架下使用秩的非凸替代函数的运动数据恢复方法,且现有的人体运动恢复方法都没有同时考虑以上两个约束。此外,本文还提出了一种基于交替方向乘子法的优化框架来求解模型的非凸优化问题。(2)提出了一种基于学习低秩核函数及核稀疏子空间聚类的人体运动分割方法。现有的人体运动分割方法普遍利用了预定义好的核函数对运动数据的非线性特征进行建模,并在投影后的高维特征空间中对运动数据进行分割。但核函数对应的特征映射从本质上讲是隐式的,使用既有的核函数并不能在理论上保证人体运动数据在投影后的空间中具有理想的线性结构。从这点出发,在核化的稀疏子空间聚类的框架下,本文提出了一种针对人体运动数据学习具有低秩特性核函数的方法,通过在分割目标函数中添加一个投影后数据的低秩正则项来保证运动序列经过核函数投影之后有更为理想的子空间结构。为了更好地求解秩最小化问题,所提出的算法使用了非凸的加权schatten-p范数而没有使用凸的核范数,以取得更好的秩的逼近效果,由此导致了该非凸优化问题不能使用现有文献中的结论进行求解。因此,本文还提出并证明了在非凸替代函数的情况下学习低秩核函数的相关结论及其证明过程,需要注意的是,本章证明的结论具有一般性,其不适用于加权schatten-p范数,还适用于其它秩的非凸替代函数。