论文部分内容阅读
随着计算机网络的广泛普及和人们对多媒体信息的需求不断提高,低码率图像压缩编码技术成为活跃的研究领域.MPEG-4作为新一代多媒体压缩标准,将众多多媒体应用集中于一个完整框架,提出基于具体视频对象的模型基编码标准,由于该编码方法在码率和图像质量性能上比传统编码方法有很大的提高,因此受到极大关注.该文将视频图像中的人脸作为专门的研究对象,根据MPEG-4为模型基编码制定的一系列标准进行编码算法研究.该文着重在Mpeg-4人脸模型基编码方面开展工作,在编码系统的前端分析及后端合成两部分中提出了若干创新点.前端分析过程采用由粗到精,由全局到局部方式进行.首先跟踪脸部整体运动,在此基础上提取脸部特征点位置.为了提高参数提取的准确度,该文提出了椭圆环模板与肤色模型相结合的算法跟踪头部整体运动.具体地,首先根据肤色模型对图像进行分割,对分割后的区域通过椭圆环方法搜索确定脸部肤色边缘.在利用肤色模型分割区域的过程中可同时定位出眼睛和嘴巴的位置,根据该特征位置和椭圆环位置可实现人脸姿态估计.在脸部特征提取的研究中,该文提出两种方法:(1)利用脸部光流场和CANDIDE模型相结合的方法.首先通过lucas-kanade算法得到光流场并由此确定表情变化,为增加特征提取的准确性还利用了模型拓扑结构和脸部特征之间的位置关系.(2)利用特征模板进行精确定位的方法.此方法为各个特征(眼睛和嘴巴)建立独立特征模板,通过分析灰度和肤色边缘进行模板匹配,实现特征精确定位.特征点位置的准确提取是获得人脸动画参数(FAP)的关键,这对于模型基编码是非常重要的.在后端合成中,该文研究了根据面部动画参数驱动特定人脸模型,生成基于伪肌肉模型的MPEG-4人脸动画,减小动画驱动的计算量.人脸模型建立使用的是通过扫描仪得到的人脸纹理,增加了真实感.该文最后将分析端和合成端的工作集成为一个模型基编码的完整实验系统.通过同一段视频中提取出的面部动画参数,驱动不同的面部模型,得到相同的人脸表情,证明了面部动画参数的模型独立性.