论文部分内容阅读
情感虚拟人(Emotion Virtual Human)技术是具有多模态情感行为协同表现能力的计算机虚拟技术,从本质上讲是一种实时、直观的人机交互手段。虚拟实境(Virtual Reality)是利用计算机仿真技术模拟真实世界的视觉,听觉甚至触觉等多种感观,让人置身于一个真实中并不存在的仿真世界的技术。语音情感识别(Speech Emotion Recognition)是将人类语音中的情感因素进行提取与分辨,达到利用计算机分析人类语音中情感因素的目的。本文将情感虚拟人技术、虚拟实境技术与语音情感识别三者有机的结合起来,着力于研究更简单直观和更人性化的人机交互技术,搭建一个从真实世界人类情感语音到虚拟世界情感虚拟人的交互桥梁。本文的具体工作如下:第一,研究和分析当今心理学界和情感语音识别研究领域对于情感模型的分类,比较各种模型的特点,从而根据汉语普通话语音信号在语音识别上的特点,选择了高兴、生气、悲伤、惊讶和中性这五种状态的情感模型。第二,在语音情感识别方面,获取标准的普通话情感语音素材库,研究对语音信号的前端处理与分析,提取语音信号中包含的情感特征向量,利用参数选择对所提取的特征向量进行以降维为宗旨的筛选,去掉语音情感特征参数中冗余的部分,选择样本中类内距离小而类间距离大低耦合度特征向量组合,提高识别率。第三,利用隐马尔可夫链模型对语音信号进行情感识别。语音情感识别与语音语意识别在本质上是相通的,隐马尔可夫式已广泛用于语音语意识别中,而通过对所获取语音样本的特征提取与模式识别的实验,证明隐马尔可夫式在语音情感识别方面具有较高的识别率与较好的识别效果。第四,在虚拟实境与虚拟人搭建方面的研究,利用3D建模软件Maya和虚拟实境软件Virtools建立情感虚拟人,说明了虚拟人的建模与控制详细过程,通过控制模块来完成虚拟人对所识别的情感结果在视觉上的呈现与反馈,达到人机交互的良好效果。