基于MPEG-4的人脸模型基编码技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:lvyuxuan3652008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络的广泛普及和人们对多媒体信息的需求不断提高,低码率图像压缩编码技术成为活跃的研究领域.MPEG-4作为新一代多媒体压缩标准,将众多多媒体应用集中于一个完整框架,提出基于具体视频对象的模型基编码标准,由于该编码方法在码率和图像质量性能上比传统编码方法有很大的提高,因此受到极大关注.该文将视频图像中的人脸作为专门的研究对象,根据MPEG-4为模型基编码制定的一系列标准进行编码算法研究.该文着重在Mpeg-4人脸模型基编码方面开展工作,在编码系统的前端分析及后端合成两部分中提出了若干创新点.前端分析过程采用由粗到精,由全局到局部方式进行.首先跟踪脸部整体运动,在此基础上提取脸部特征点位置.为了提高参数提取的准确度,该文提出了椭圆环模板与肤色模型相结合的算法跟踪头部整体运动.具体地,首先根据肤色模型对图像进行分割,对分割后的区域通过椭圆环方法搜索确定脸部肤色边缘.在利用肤色模型分割区域的过程中可同时定位出眼睛和嘴巴的位置,根据该特征位置和椭圆环位置可实现人脸姿态估计.在脸部特征提取的研究中,该文提出两种方法:(1)利用脸部光流场和CANDIDE模型相结合的方法.首先通过lucas-kanade算法得到光流场并由此确定表情变化,为增加特征提取的准确性还利用了模型拓扑结构和脸部特征之间的位置关系.(2)利用特征模板进行精确定位的方法.此方法为各个特征(眼睛和嘴巴)建立独立特征模板,通过分析灰度和肤色边缘进行模板匹配,实现特征精确定位.特征点位置的准确提取是获得人脸动画参数(FAP)的关键,这对于模型基编码是非常重要的.在后端合成中,该文研究了根据面部动画参数驱动特定人脸模型,生成基于伪肌肉模型的MPEG-4人脸动画,减小动画驱动的计算量.人脸模型建立使用的是通过扫描仪得到的人脸纹理,增加了真实感.该文最后将分析端和合成端的工作集成为一个模型基编码的完整实验系统.通过同一段视频中提取出的面部动画参数,驱动不同的面部模型,得到相同的人脸表情,证明了面部动画参数的模型独立性.
其他文献
CORBA是面向对象的软件工程发展到一定程度的必然产物,研究和运用CORBA是当今计算机学科中具有重要现实意义和广泛应用前景的课题之一。 本文以LIMS(文献信息管理系统)系统
随着信息化的快速发展,人类的知识总量也在急剧增加,尤其是代表人类知识前沿的科技文献正在以每年6%-8%的速率增长。这就使得论文检索难度大大增加。科研人员为了找到自己需
随着多媒体通信时代的到来,网络多媒体、无线多媒体业务逐渐受到越来越多用户的青睐。靠现存的视频压缩标准已经不能满足应用需求。因此,ITU的视频编码专家组与ISO的运动图像编
本研究从搜索和分析农作物信息、环境地理信息和管理信息及三者之间的关系入手,利用GIS和ES集成技术,综合现有的技术成果和专家经验,建立了以农作物管理为主体的电子农务平台,以
经典智能规划多是在强约束假设条件的基础上建模的,例如要求规划agent对于动作的结果的知识完全,且规划agent执行动作的结果是确定的,从而不能运用于大多数实际系统和实际领域中
在分布式环境尤其是包含异构系统的分布式环境中,系统管理比集中式系统要困难得多.理想的是提供一个单点控制,所有系统都可在此管理.高度集中的管理由于其复杂性和权力分配问
当今围绕着JVM的研究和开发日益增多.在各种JVM发展的同时,也带来另一种需求——如何提供运行在JVM上的各种软件,如何将现有系统移植到JVM上运行?单纯地利用Java编程,一方面
随着计算机网络技术的飞速发展,网络安全问题日益受到人们的重视,相关的网络安全技术的研究也越趋深入.传统的网络安全产品已不能满足现代P2DR动态系统安全模型的要求.人们迫
本课题来源于深圳市民中心屋顶网架结构健康智能监测系统项目。本文的主要内容是研究如何创建多媒体视景环境、大型屋架结构受力分析的有限元结果数据可视化的相关算法以及可
有线电视网络是信息化进程中一个重要的基础网络,HFC有线电视网有着极好的数据传输环境,具有高带宽、大容量和很高的用户拥有率,而被国际上公认为是通向广大用户多种信息业务的