论文部分内容阅读
人体运动捕获是计算机视觉研究领域的重要课题之一,也是近年来备受研究者关注的前沿方向。本文集中研究基于数据库的运动技术进行人体三维重建,包括对动作的检索和查询和动作数据库的存储架构。运动捕获数据的快速增长使得动作复用变的越来越重要。现存的大多数的方法是人工的从大型动作数据库中浏览和选择出理想的动作片段,但这是非常低效的,因此,本文使用基于数据库的方式,用户可以根据输入数据查询系统,得到想要的动作,这就节省了人力,提高了效率。本文提供两种方式来得到系统的输入数据。第一,系统提供了一个用户接口,用户可以随意的去改变模型的姿态,然后我们转化为数据,作为用户的输入数据。这样方便用户可以准确的去描述一个动作然后查找数据库。第二,可以用单目视频作为用户的输入,经过去背景,得到轮廓,自动标注关节点,进行目标跟踪d等一系列过程来得到输入数据。在查找之前,本文要对数据进行处理,使得检索可以快速的进行。因此,本文使用主成分分析(PCA)方法提取输入动作和数据库中动作的特征向量,然后建立了动作类和它们的特征向量的一一对应关系。考虑到我们要达到实时的效果,在检索期间我们进行了并行计算。使用GPU进行硬件加速,降低匹配时间。实验表明,本文的算法大大降低了查询所需要的时间,同时保证了精确度,达到了实时的效果。最后,本文根据阈值得到一个结果序列,如果是输入时单帧,那么我们就选择最接近的一帧。如果输入是一个帧序列,那么本文就由帧序列与帧序列的匹配算法去得到最终的匹配结果,使得结果序列之间尽量的平滑,尽量的接近原始的序列。数据库的存储一直没有受到重视,当动作很多时,我们要考虑用优化架构去存储,降低空间复杂度。相对于去存储每一帧动作的关节点的坐标,我们可以去存储特征向量,然后用奇异值分解(SVD)的思想进行矩阵压缩,这样就很好的控制了数据库的大小。分析实验结果可知,本文设计的算法能很好的解决运动捕获中现有的关键问题,为深入研究奠定了很好的理论基础。