论文部分内容阅读
随着社会的现代化发展,图像处理,机器学习及智能计算领域作为信息及计算机技术的重要分支,其研究更是日益显得重要。人体运动形态估计作为这几个领域的交叉热点研究课题,近些年受到国内外很多学者的关注,其已经成功应用于角色动画的制作,3D人物的立体电影制作,人体运动医学诊断等等多个领域。人体运动形态估计的研究源于对物体运动的视频跟踪,目标检测及监控遮挡的处理。视频跟踪的实现在于视频里输出简单的标记来套着运动的物体。后来发现,仅仅是做简单的标记形状跟踪不能满足我们对运动物体许多参数的获取,并且人体运动形态估计就属于这类问题的研究。由于人体运动形态估计和物体视频运动跟踪类的处理有类似的特征,而且其能进行广泛应用,使我们生活多个方面受益,所以研究就进一步发展和细化到了人体运动形态估计,以此来获取更多的人体运动信息,以满足我们的需求。本文对人体运动形态估计的研究主要从隐变量概率统计模型入手,再结合图像处理及智能计算的一些理论进行。其主要核心问题有两个,其一,利用隐变量概率统计模型对三维人体运动形态的已知高维数据样本进行学习,然后估计出未知的三维人体运动形态;其二,对多视角人体运动图像进行处理,提取出多视角人体运动的轮廓特征,利用该轮廓特征估计出其对应的三维人体运动形态。本文主要工作概括如下:1.GPDM无法学习不完整步态(不足一个运动周期)覆盖的人体运动形态样本来对人体运动形态进行估计。因此,空间约束概率估计算法的提出解决了这个问题,其可计算出不完整步态中的缺失姿态样本在隐变量空间的隐变量数据,从而利用该数据估计出其相应缺失姿态样本(高维数据样本),以此补全不完整步态的隐变量数据和其相应的姿态样本(高维数据样本),再带入GPDM进行训练,实现人体运动形态的估计。2.为了实现估计出两段不相关人体运动形态之间的过渡运动形态,本文提出隐变量数据特征相似度优化学习算法来实现对人体过渡运动形态的估计。该算法是在平衡高斯动态模型(B-GPDM)的学习算法基础上进行改进,通过建立相关隐变量数据投影距离和投影长度的目标函数,学习过程中不断对随机初始化的过渡运动形态的隐变量数据进行优化,即特征相似度优化(FSO)。该模型完成学习后,可以估计出两段不相关人体运动形态之间的过渡运动形态。3.为了更好实现对两种不同的人体运动形态(周期性运动形态)高维数据样本进行拟合,并且其中有数据样本为不完整步态的数据样本,本文提出一种基于正交子空间搜索的流形隐概率优化(MLPO-OSS)算法,该算法可以增强不完整步态的高维数据样本的数据拟合,从而更好的估计人体运动形态。4.为了从多视角运动图像的轮廓特征较准确的估计出相应三维人体运动形态,本文提出双隐变量空间局部粒子搜索算法(DLVSLPS)。该算法用高斯过程动态模型(GPDM)降维建立双隐变量空间和隐变量数据到高维数据的映射关系后,然后对双隐变量空间的低维粒子使用近邻权重先验条件搜索(NWPCS)进行局部搜索来生成较优高维粒子,从而估计相应帧的三维人体运动形态。与传统的粒子滤波算法(APF,PSO-PF,PF)相比,其可以产生有效且正确粒子进行估计,并且有较好的性能。5.在已知少量高维数据样本的条件下,本文提出低维空间(隐变量空间)增量学习算法从多视角运动图像序列的轮廓特征较准确的估计出相应三维人体运动形态。该算法利用随机极值记忆自适应搜索(SEMAS)算法和增量概率降维模型(IPDRM)对三维人体运动形态进行估计,收集相应新高维数据样本,然后,再通过IPDRM对所收集的新高维数据样本进行增量降维,获取其低维数据(隐变量数据),再根据低维数据的距离(相似度)比较,对新高维数据样本进行选择后更新低维空间到高维空间的映射关系完成增量学习,进而估计相应三维人体运动形态。该算法与一些传统的算法相比又进一步提高了估计性能。6.为了提高从多视角运动图像的轮廓特征估计出相应三维人体运动形态的准确程度,本文提出了高斯增量降维与流形Boltzmann优化(GIDRMBO)算法。该算法把表示人体运动立体模型的高维数据按空间位置信息与姿态信息进行分段,即分成两个子向量,用高斯增量降维模型(GIDRM)分别对两个子向量样本进行降维,获取两个子向量样本的低维数据(隐变量数据),建立相应低维空间(隐变量空间)及映射关系。然后,在分别在相应的子向量低维空间,使用流形Boltzmann优化(GIDRMBO)来寻找与多视角运动图像的轮廓最匹配的子向量,组成最终表示人体运动立体模型的高维数据,从而进行估计。该算法与传统算法相比,其也具有较好的性能。上述研究工作表明恰当使用隐变量概率统计模型能够很好估计三维人体运动形态,其可以对表示三维人体运动形态复杂的高维数据进行学习,简化该数据,使人体运动形态的特征规律容易掌握。若其能再结合智能计算方法可以获取很好的估计效果。