基于HMM的情感语音识别

来源 :太原理工大学 | 被引量 : 8次 | 上传用户:jieminglin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机的普及以及计算机科学技术的迅猛发展,人类对计算机的依赖性不断增强,一场信息革命正在酝酿,新型的人机交互技术正逐渐成为研究热点。语言本身作为人类特有的功能,在人类进行思想、观点和情感交流等信息的相互传递中发挥着重要的作用,语音信号中的情感信息研究正越来越受人们的重视。情感语音识别作为情感语音信号处理研究的一个重要分支,在实现人机自然交互方面有重要的作用。本文首先介绍了情感语音识别的研究背景与研究意义、研究现状以及应用前景,接下来介绍了目前国内外对情感的分类和一些常用的识别方法。在对国内外情感语音库了解的基础上,从确定情感类别、选择录音脚本、实验环境及设备的要求等方面综合考虑,录制了包含高兴、中性、生气三种情感的情感语音库,并经过了主观辨听实验,选取了其中情感识别度较高的语句进行情感语音识别的实验。在对语音信号的情感特征进行分析之后,对本文实验所用的各种特征参数的提取方法进行了详细的介绍,提取了基音频率及其一阶、二阶导数,短时能量的一阶、二阶、三阶导数,第一共振峰及传统特征参数MFCC特征、抗噪特征参数ZCPA特征等特征参数。然后重点介绍了本文中情感语音识别模型的建模思想和建模方法。使用从左到右的有跳转的连续隐马尔可夫模型(CHMM)进行情感语音识别,从模型的初始化、参数训练和情感识别几个方面概括了研究的整个工作过程。在情感的训练识别中,分别使用了单个MFCC特征参数,单个ZCPA特征参数和九维的情感特征参数矢量在平静、有噪声情况下进行训练和识别。实验结果表明,三种情感的总体识别效果都比较理想,在各组的识别结果中相同条件下对比,三种情感中的中性的识别率更好一些。在噪声环境下,单个ZCPA特征参数和综合的情感特征参数矢量的识别效果要明显好于传统的MFCC特征参数。最后讨论了该领域存在的一些问题,本次研究中的不足和今后需要进一步研究的课题。
其他文献
随着信息技术和多媒体技术的发展,普通的音视频素材已经不能满足人们生产活动和娱乐生活的需求。应运而生的语音变调技术,是在保持音频文件播放速度不变的前提下,按照某种算
在SAR图像处理的理论研究和实际工程应用中,图像的表达和分解研究具有非常重要的意义。SAR图像的小波分析克服了短时傅立叶变换在单分辨率上的缺陷,具有多分辨率分析的特点,可以
有限混合模型作为分析广泛随机现象的一种数学统计建模工具,可用来定义任何复杂的概率分布,在许多统计数据建模的理论研究和实际工程中得到广泛的应用。由于形式简单、计算方
学位
随着信息技术的不断发展,物联网具有广阔的应用前景。RFID技术作为物联网核心技术之一,也得到了很广泛的应用和发展。阅读器作为RFID系统重要组成部分,在系统中起着重要作用,具有
当大规模流感或传染性疾病爆发时,在学校校园这种人群居住比较密集的环境下,一旦出现一例传染源,将容易导致发生大规模传染性疾病。在监控流行性传染病的指标中最直接的指标
针对LTE系统中小区间干扰比较严重,已有的干扰协调技术不能很好的解决边缘用户频谱效率低的问题,在LTE-Advanced系统中引入了协同多点传输和接收(CoMP)技术。该技术通过各个小
TD-SCDMA(时分-同步码分多址)是由CWTS(中国无线通信标准化组织)提出的、拥有我国自主知识产权的第三代移动通信标准(简称3G)。该标准将智能天线、联合检测、同步CDMA和SDR(