论文部分内容阅读
本文通过对发音者可见器官动作的研究,从视觉方面抽取汉语发音的26个基本口形,并利用MPEG-4所规定的面部动画参数(FAP)来描述这些口形,从而获得了符合国际标准的描述汉语发音的视觉参数.另外,我们研究了这些参数在连续语流中的变化及协同发音对口形的影响,基于已有的汉语文语转换系统(Sonic)和二维网格人脸模型(P1aneFace)实现了一个汉语文本-可视语音转换系统(TTVS).