论文部分内容阅读
作为情感计算重要分支的语音情感识别,通过利用计算机及其它辅助设备分析和提取语音信号的情感特征参数,进而分析情感状态及状态的变化规律,从而更大贡献地提高人机交互技术的智能性和自然性。目前,基于孤立情感语句分析的语音情感识别研究已经取得了非常优异的成就,特别是已经在通信、医疗、客服系统、远程教育等领域得到大量应用,但在现实世界中,人的情感表达是连续流畅的,因此,针对连续语音的情感识别研究更加具有现实意义。本文正是针对人的说话具有连续性,前后间是有规律的特点,提出从前后相邻情感语句中提取上下文语音情感特征和考虑情感上下文信息的情感推理规则,并通过实验论证其有效性和贡献性。论文的主要工作如下:
(1)提出基于声学上下文的语音情感特征提取与分析。针对语句之间的情感存在相互关联的特性,从声学角度提出上下文动态情感特征、上下文差分情感特征、上下文边缘动态情感特征和上下文边缘差分情感特征共四类268维语音情感上下文特征以及这四类情感特征的提取方法,该方法是从当前情感语句与其前面若干句的相邻句中提取声学特征,建立上下文特征模型,以此辅助传统特征所建模型来提高识别率。其中,两模型间采用基于模糊密度的多模型间的决策融合算法融合为一个完整的模型。最后,将该方法应用于语音情感识别,实验结果表明,加入新的上下文语音情感特征后,六类典型情感的平均识别率为82.78%,比原有特征模型的平均识别率提高了约8.89%。
(2)提出基于情感上下文的语音情感推理算法。针对在日常说话中,前后相邻情感语句的情感变化存在相互关联的特性,提出基于情感上下文的情感推理算法。此算法首先利用待分析情感语句的传统语音情感特征和上下文语音情感特征分别识别其所属的情感状态,然后借助于情感交互矩阵以及两类情感特征识别结果的置信度对待测试语句所属的情感类别进行初次推理。在此基础上,建立了一种语音情感上下文推理规则,利用该规则根据上下文情感状态对待分析情感语句情感状态进行调整,最终得出待分析情感语句所属的情感类别。将此算法应用于语音情感识别,实验结果表明,此算法使得6类典型情感的识别效率均得到了提高,其中,连续语音的情感识别的最优结果为75.10%,比单一模型的识别率提高了12.17%。
(3)基于上下文的语音情感识别原型系统在Matlab2012a环境实现开发。主要实现的功能有语音信号的预处理、情感特征参数的提取及降维、模型的训练和语句的情感识别,其代码均由Matlab语言实现。最后,通过从不同库、不同方面实验结果的对比和分析,证明了本文提出的上下文语音情感特征和情感推理算法的可行性和有效性。