论文部分内容阅读
语音传递信息是人类最常用、最重要的交换信息的方式。语音中包含了丰富的语义信息和情感信息,人们往往只注重语音中所包含的语义信息而忽略了情感信息,然而这些情感信息又是计算机理解人类情感的关键。此外,语音情感识别作为情感计算的一个重要的分支,同时也是语音识别领域的一个重要的研究方向,其涉及到心理学、人工智能、信号处理、模式识别等多个领域,因此,具有很重要的研究意义。针对语音情感识别对语音信号特征的依赖性,不同情感与声学特征之间的关联问题。本文将关联规则算法引入情感计算领域,用于对语音信号特征的抽取中,提出了基于Apriori算法的语音情感中韵律特征抽取算法(prosody featureextraction algorithm in speech emotion based on apriori,简称PFEA_AP算法),并且在汉语情感语料库和国外的语音情感数据集上进行了相关实验,实验结果表明,本文的PFEA_AP算法所抽取的特征在降低维度的同时还能够有效提高情感分类精度,从而验证了新算法所抽取特征的有效性,为后续语音情感识别研究的特征选择提供理论依据。本文的主要工作如下:第一,详细分析了语音情感识别研究中常用的韵律学特征和谱特征,针对语音情感特征的复杂性,使用praat软件提取出语音信号中的韵律学特征数据,将提取的特征数据进行离散化处理,构建出语音情感韵律特征的关联规则挖掘模型。第二,在此基础上,分别使用Apriori算法和FP-growth算法对语音情感韵律特征进行抽取,分别从算法生成的有效规则数和运行时间分析比较两种算法抽取特征的优劣,最终选择基于Apriori算法的语音情感韵律特征抽取。第三,首先在汉语情感语料库上使用SVM和BP神经网络算法对所抽取特征进行仿真实验,接着又使用fisher线性判别法选择的特征与PFEA_AP算法抽取的特征进行比较,说明新算法抽取特征的有效性。为了验证不同国家的人情感表达的差异,又在国外情感数据集EMO-DB上进行了实验,结果表明不同国家的人情感表达的发音规律不同。