基于SVM的汉语语音情感识别研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:liuyumingming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音情感识别技术是近年来人机交互领域新兴的研究课题之一,有着广泛的应用前景,该技术主要包括情感语料库的建立、语音情感特征参数的提取及语音情感识别分类器的选择等。本文的主要工作是建立了一个汉语情感语料库,设计了一种基于短时 TEO能量的端点检测算法,采用 SVM对语音情感的 TEO-MFCC、AF-MFCC、DAF-MFCC参数进行识别和比较,同时采用增减分量法研究了MFCC、Mid-MFCC和 IMFCC各倒谱分量对语音情感识别的贡献,选取最优倒谱分量组成混合参数并将其应用于语音情感识别。  本文首先介绍了情感的分类方法,详细地阐述了特征参数的研究现状,介绍了目前应用于情感识别的常用特征降维方法,并对其进行分析比较。基于对情感语料库构建方法的描述,建立了包含悲伤、生气、中性和高兴四种情感状态的汉语情感语料库,并根据主观听辨实验结果对情感语料库进行有效性选择,最终得到480句情感语料。  其次,分析了端点检测过程对情感识别系统的重要性,设计了一种在噪声环境下基于短时TEO能量的语音信号端点检测算法,并将其与传统的双门限法和谱熵法进行不同噪声和不同信噪比的对比实验,实验结果表明,本文设计的算法用于低信噪比带噪语音时可保持较高的端点检测正确率。  最后,介绍了MFCC和ΔMFCC,并将MFCC与不同形式的TEO结合得到三种非线性特征参数——TEO-MFCC、AF-MFCC和DAF-MFCC,采用SVM分别对这五种特征参数进行语音情感识别实验。实验结果显示,除 TEO-MFCC的情感识别率为89.167%外,其余四种特征的情感识别率都达到了90%及以上。另外,介绍了两种改进MFCC的特征参数——Mid-MFCC和IMFCC,运用增减分量法计算了MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提取这三个特征参数贡献最高的几阶倒谱分量组成了新的特征参数。实验结果显示,由MFCC中贡献最高的12阶倒谱分量组成的特征参数可达到91.67%的情感识别率;由贡献最高的8阶MFCC倒谱分量、4阶Mid-MFCC倒谱分量和4阶IMFCC倒谱分量组成的16阶混合参数可达到92.083%的情感识别率。
其他文献
随着黑客入侵事件的日益猖獗,人们发现只从防御的角度构造安全系统是不够的。入侵检测技术对计算机和网络资源的恶意使用行为进行识别和响应,不仅检测外部入侵行为,同时也监
Web Services是计算机IT技术的第三次革命.Web services技术在现有的各种异构平台上,构筑了一个通用的,与平台无关语言无关的技术层,不同平台上的应用依靠这个技术层来实施相
数据仓库技术是数据库技术的一个研究方向,能够有效的管理传统数据库产生的历史数据,并向各种决策支持应用如联机分析处理、数据挖掘等提供有力数据支持,适应了企业用户对数
数据流分析是一种程序静态分析技术,它能从程序代码中收集程序的语义信息,并通过代数的方法确定变量的定义和使用。通过数据流分析,可以不必实际运行程序就能够发现程序运行
长期以来,计算机其他部件如CPU,内存等性能快速提升,而磁盘由于其固有的机械运动的限制,性能已难以提高,成为制约系统性能的瓶颈。而在一些特定的应用场景如web应用环境中,保存在we
远程教学作为一种新型的教育模式已成为近年来各国教育界的重要研究课题。基于Internet的虚拟实验室是现代远程教学质量提高的关键,因为实验是大部分工程类和应用类课程的重要
基于策略的网络管理以整个网络为管理对象,能解决传统网络管理不能解决的一些问题,正逐渐成为一种新的网络管理方案。因此将策略管理和传统的SNMP管理结合起来,提出了基于策
构架设计是从问题空间向软件解空间过渡的第一个活动,以构件关系模型为基础,在考虑系统实现环境(如操作系统、数据库、通信机制、中间件等)和应遵循的标准等因素的情况下,形成针
远程教育是未来教育的发展方向,教学管理系统是远程教育支撑平台的重要组成部分。教学管理系统的性能与功能直接决定了教学管理的水平和教学活动的质量,是执行和实施教学计划、
本文对基于Linux2.4内核的混合增强型嵌入式防火墙的设计与实现进行了分析和讨论。论文介绍了防火墙在网络应用中的重要地位及应用情况,概述了当今实际应用中的防火墙类型及关