基于矢量量化的说话人识别算法的研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户：kingboxing

【摘要】

：

说话人识别是指通过说话人的语音说话人识别是指通过说话人的语音来自动识别说话人的身份,它在许多领域内有良好的应用前景。本说话人识别系统采用了矢量量化方法,它包括两个

【作者】

：

史蓓蕾

【机构】

：

武汉理工大学

【出处】

：

武汉理工大学

【发表日期】

：

2006年期

【关键词】

：

说话人识别美尔倒谱系数(MFCC) 矢量量化(VQ) LBG算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

说话人识别是指通过说话人的语音说话人识别是指通过说话人的语音来自动识别说话人的身份,它在许多领域内有良好的应用前景。本说话人识别系统采用了矢量量化方法,它包括两个主要的模块:特征提取和特征匹配。在特征提取过程中,将提取少量的能够体现每个说话人的特征的语音信号的参数。在特征匹配模块中包括有两个步骤:一是训练步骤,二是识别步骤。本文首先在研究了语音信号的一般处理方法的基础上,重点研究了双门限端点检测算法和LPC美尔倒谱特征端点检测方法的基本理论。并且研究了语音信号的数字模型,包括激励模型、声管模型和辐射模型三个子模型。然后,在研究说话人识别的参数和特征提取原理的基础上,重点研究了美尔倒谱系数(MFCC)的原理和特点,并且设计和实现了美尔倒谱系数提取过程。接着,在介绍了矢量量化的基本原理和失真测度方法的基础上,重点研究了矢量量化器最佳码本设计的算法——LBG算法,选择为本系统的矢量量化方法。最后提出了一种以MFCC为特征的基于近邻划分算法的矢量量化的说话人识别方案,并在MATLAB上进行了仿真实验,得出了识别速度变快,识别精度高等意义的结论。本系统通过MATLAB语音处理工具箱,提取输入语音的特征参数,采用美尔倒谱系数特征参数,提高了系统的识别性能,采用LBG算法进行码书设计,并通过使用矢量量化技术为每一说话人设计码书,避免了由于说话人使用同一码书带来的量化误差。本系统获得了很高的识别率,并且具有运算速度快,计算量小,差错率低等优点。

其他文献

基于数据驱动的回转式空气预热器转子热变形建模研究

容克式空气预热器(简称:空预器)是火力发电厂常用的锅炉尾气回收利用装置,其工作原理是利用锅炉尾气中含有的热量来加热即将进入炉膛助燃的空气和制粉系统所需的空气,可以有

学位

空气预热器转子热变形建模模糊支持向量机聚类方法数据驱动

蛋白质与配体绑定位点预测的特征抽取及学习算法研究

学位

基于DM642的视频编码算法研究

目前,H.263视频压缩标准凭借其高压缩比和图像的质量,已经作为一种新型的标准被广泛的接受。而H.263的优越性能是以其复杂度的成倍增加为代价换取的,因此一般的处理平台已经

学位

DM642H.263视频编码移植优化

基于进化计算的软件过程优化与成本估算研究

软件是信息社会的基石,软件产业也因此成为当今世界各国竞争的关键之一。半个多世纪以来,软件发展历程中暴露出种种问题,例如成本超支、进度失控、工期超期、生产率和资源利

学位

软件过程进化计算成本估算活动规划资源配置

基于J2EE电信计划建设管理信息系统的设计与实现

在社会高速信息化时代，企业管理实现信息化如同为企业的管理修建一条高速公路，可以帮助企业提高工作效率并为其提供决策。随着Internet的进一步发展，企业应用体系架构正从简单的

学位

SOAJ2EEEJBMVC设计模式系统整合

粗糙集与灰色系统理论结合应用的研究

粗糙集理论和灰色系统理论都是处理不完全、不精确及不确定性信息的有效工具，通过对这两种理论进行结合和互补来研究处理不确定性问题的更有效和更一般化的方法，无疑是一项有重

学位

粗糙集灰色系统理论不确定性信息处理模糊灰集区间灰集

基于阻抗控制的机器人柔顺性控制方法研究

本论文来源于863高技术项目《仿人机器人柔顺性控制技术研究》的子课题,研究针对手臂模型未知和动态环境下的仿人机器人手臂柔顺性控制算法,根据不同任务在线控制仿人机器人

学位

机器人阻抗控制神经网络逆系统柔顺性控制

大气中苯系物自动监测仪系统软件研制

通过新闻媒体向社会发布城市空气质量日报,告知市民其享有的城市空气质量状况,增加环保的透明度,增强全民的环保意识,提高城市的知名度,是政府环保工作的重要举措之一。随着

学位

大气苯系物自动监测系统PC/104驱动程序富集-解析串口通信数据库

基于以太网的远程监控系统的设计与实现

本文主要提出了一种基于以太网技术的嵌入式通信模块的构架和设计方案，并利用Microchip公司生产的高性能PIC18F系列微处理器为平台进行实现。以太网技术作为一种功能强大

学位

以太网TCP/IP嵌入式系统模块微处理器

一种基于DSPs的多路音/视频采集处理系统的设计

图像声音采集处理技术在信息处理技术中占有非常重要的地位,它涉及工业检测、医疗设备、军事、消费电子等诸多领域。在一般场合,图像声音采集处理采用基于计算机的处理系统。

学位

TMS320DM642图像声音采集处理PAL/NTSC制式

基于矢量量化的说话人识别算法的研究

其他学术论文