论文部分内容阅读
本文通过对目前比较流行的三维人脸动画技术的研究,提出了一种基于文本和语音驱动的人脸表情动画算法的实现,并拟将该算法运用到三维虚拟教学环境之中。通过虚拟教师面部表情的设计,为学习者提供更加友好的交流界面,使得教学平台更具有亲和力和人性化。本文的算法采用目前比较成熟并广泛应用的MPEG-4编码系统对三维人脸进行编码描述,算法的实现使用wxWidgets进行UI设计、利用SMIL同步多媒体集成语言对输出多媒体流进行控制、通过MS SAPI提供的TTS技术进行实时语音合成,最后通过OpenGL渲染表情动画,生成最终输出结果。此外,算法中还多处用到了第三方开源库,如Boost、SDL、Xerces-C等,使开发出来的系统具有稳定性和可移植性。文章首先介绍了研究现状、开发环境以及算法中用到的技术和开源组件,随后详细描述了三维人脸建模和人脸模型生成技术,通过分析人脸动画编码系统和模型结构,提出了模型解析、动画生成的关键算法实现:首先对人脸模型定义控制点和控制框架,利用Bernstein多项式构造控制框架,将之运用到FFD算法中控制人脸变形,并对FFD算法进行改进,然后解析SMIL脚本并对动画和语音进行实时控制,最终生成与文本匹配的语音及口型和表情动画的输出。