基于矢量量化的说话人识别算法的研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:kingboxing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是指通过说话人的语音说话人识别是指通过说话人的语音来自动识别说话人的身份,它在许多领域内有良好的应用前景。本说话人识别系统采用了矢量量化方法,它包括两个主要的模块:特征提取和特征匹配。在特征提取过程中,将提取少量的能够体现每个说话人的特征的语音信号的参数。在特征匹配模块中包括有两个步骤:一是训练步骤,二是识别步骤。 本文首先在研究了语音信号的一般处理方法的基础上,重点研究了双门限端点检测算法和LPC美尔倒谱特征端点检测方法的基本理论。并且研究了语音信号的数字模型,包括激励模型、声管模型和辐射模型三个子模型。然后,在研究说话人识别的参数和特征提取原理的基础上,重点研究了美尔倒谱系数(MFCC)的原理和特点,并且设计和实现了美尔倒谱系数提取过程。接着,在介绍了矢量量化的基本原理和失真测度方法的基础上,重点研究了矢量量化器最佳码本设计的算法——LBG算法,选择为本系统的矢量量化方法。最后提出了一种以MFCC为特征的基于近邻划分算法的矢量量化的说话人识别方案,并在MATLAB上进行了仿真实验,得出了识别速度变快,识别精度高等意义的结论。 本系统通过MATLAB语音处理工具箱,提取输入语音的特征参数,采用美尔倒谱系数特征参数,提高了系统的识别性能,采用LBG算法进行码书设计,并通过使用矢量量化技术为每一说话人设计码书,避免了由于说话人使用同一码书带来的量化误差。本系统获得了很高的识别率,并且具有运算速度快,计算量小,差错率低等优点。
其他文献
容克式空气预热器(简称:空预器)是火力发电厂常用的锅炉尾气回收利用装置,其工作原理是利用锅炉尾气中含有的热量来加热即将进入炉膛助燃的空气和制粉系统所需的空气,可以有
学位
目前,H.263视频压缩标准凭借其高压缩比和图像的质量,已经作为一种新型的标准被广泛的接受。而H.263的优越性能是以其复杂度的成倍增加为代价换取的,因此一般的处理平台已经
软件是信息社会的基石,软件产业也因此成为当今世界各国竞争的关键之一。半个多世纪以来,软件发展历程中暴露出种种问题,例如成本超支、进度失控、工期超期、生产率和资源利
在社会高速信息化时代,企业管理实现信息化如同为企业的管理修建一条高速公路,可以帮助企业提高工作效率并为其提供决策。随着Internet的进一步发展,企业应用体系架构正从简单的
粗糙集理论和灰色系统理论都是处理不完全、不精确及不确定性信息的有效工具,通过对这两种理论进行结合和互补来研究处理不确定性问题的更有效和更一般化的方法,无疑是一项有重
本论文来源于863高技术项目《仿人机器人柔顺性控制技术研究》的子课题,研究针对手臂模型未知和动态环境下的仿人机器人手臂柔顺性控制算法,根据不同任务在线控制仿人机器人
通过新闻媒体向社会发布城市空气质量日报,告知市民其享有的城市空气质量状况,增加环保的透明度,增强全民的环保意识,提高城市的知名度,是政府环保工作的重要举措之一。随着
本文主要提出了一种基于以太网技术的嵌入式通信模块的构架和设计方案,并利用Microchip公司生产的高性能PIC18F系列微处理器为平台进行实现。 以太网技术作为一种功能强大
图像声音采集处理技术在信息处理技术中占有非常重要的地位,它涉及工业检测、医疗设备、军事、消费电子等诸多领域。在一般场合,图像声音采集处理采用基于计算机的处理系统。