论文部分内容阅读
随着计算机技术的迅速发展,计算机应用在各行各业迅速得到普及,人机交流也变得越来越普遍。目前,机械式的人机交互已经不能适应人的需求,新型和谐的人机交互技术(Human-Computer Interaction)逐渐成为重要的计算机研究方向。情感计算(Affective Computing)是关于、产生于和影响于情感方面的计算,其目的是赋予计算机识别、理解、表达和适应人情感的能力。情感计算通过各种传感器获取由人的情感所引起的表情及生理变化信号,利用“情感模型”对这些信号进行识别,从而理解人的情感并做出适当的响应。作为情感计算的一个重要组成部分的语音情感识别,就是通过分析人们语音在情感表示方面的变化规律,利用计算机从语音信号中准确提取语音情感特征参数,并根据这些特征参数确定被测对象的情感状态。相对于有几十年研究历史的语音信号处理,语音情感识别的着眼点不是语音信号处理中语音词汇表达的准确性,而是从前研究中完全忽略的包含在语音信号中的情感和情绪信息。语音情感识别可以被看成是一个模式识别问题。人们通常会提取很多语音特征作为情感特征,将提取的语音特征输入分类器进行情感识别。然而,提取的这些众多的语音特征里面可能存在冗余特征和与语音情感识别不相关的特征。这些冗余特征和不相关特征对语音情感识别效果和识别效率都有很大影响。本文提出了一种基于粗糙集和支持向量机的汉语语音情感识别方法,采用基于粗糙集理论的属性约简算法进行语音情感特征选择。经过特征选择,降低了输入的特征矢量的维数,去除了冗余信息和不相关信息。实验结果表明,这种特征选择能在保持识别率的情况下,能有效减少特征维数,从而提供系统识别性能。本文采用支持向量机(SVM)识别汉语语音信号中的六类情感:高兴、生气、悲伤、惊讶、恐惧、中性状态,并给出了识别结果和实验分析。还开发了一个语音情感识别系统的实验原型系统,为以后的进一步研究奠定了基础。最后,讨论了该领域存在的一些问题和今后需要进一步研究的课题。