汉语孤立词语音识别的研究与实现

来源 :西北大学 | 被引量 : 0次 | 上传用户:scg5252
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
孤立词语音识别实现简单、技术成熟,有着广泛的应用领域,是深入进行语音识别研究的基础。隐马尔可夫模型(HMM)是目前最流行的语音识别技术,许多成功的语音识别系统都是基于该技术实现的。本文通过一个在Windows平台上用VC++实现的基于连续隐马尔可夫模型(CDHMM)的汉语小词汇量、非特定人、孤立词语音识别系统,对孤立词语音识别进行了研究。论文首先研究了语音识别的基本知识,主要包括语音识别的原理;语音信号处理的基本知识;各种语音识别和训练的方法。然后研究了隐马尔可夫模型的原理及其在语音识别中的应用。在此基础上论文主要工作有以下:1)完成了一个使用连续隐马尔可夫模型的汉语小词汇量、非特定人、孤立词语音识别系统的设计和实现,并进行了实验。由于使用VC++实现系统,对信号处理较为复杂。因此在实现时没有选用美尔频率特征系数(MFCC),而是选用了近似于MFCC但计算相对简单的LPC美尔倒谱系数(LPCMCC)作为特征参数。2)实验时发现系统中的双门限端点检测方法对噪声较敏感,当语音信号中混入噪声时,检测结果就会变得不准确;针对这一问题,对端点检测做了研究,提出了一种变帧长自适应门限的端点检测方法;3)分析了特征参数各维系数在语音识别中的贡献,给出了提高特征参数抗噪声性能的方法;4)最后本文针对Baum-Welch算法进行HMM参数估计速度慢、效率低的问题,给出了改进的方法。在使用Baum-Welch算法训练HMM模型时,语音识别系统的速度和效率比较低,因此优化训练方法尤为重要。
其他文献
工作流是一类能够完全或者部分自动执行的过程,它根据一系列预先定义的过程规则、文档、信息或任务能够在不同的执行者之间进行传递与执行。工作流系统的大规模应用体现了当
本课题来源于海信研发中心数字多媒体技术国家重点实验室“数字电视系统软件及通用模块软件开发”项目,项目目标是为该企业数字电视机顶盒应用开发提供一个高度可移植的中间
浩如烟海的互联网信息推动了搜索引擎的普及和应用,同时也促进了搜索引擎技术的蓬勃发展。当今搜索引擎的各项技术日趋成熟,学术界也逐渐将目光从搜索引擎技术本身转移到搜索
局部泛化误差模型是一种评估分类器泛化能力的新型误差模型,以往关于该误差模型的主要研究都集中在分类器的结构选择和特征选择上,本文是局部泛化误差模型在样本选择领域的初
随着移动网络的快速发展,社交网络在社会联系、相互学习、国家政治个人娱乐和发展等多个方面给人类提供了更多的机会。社交网络服务允许建立个人信息来展现自己,发展自己的社交
拒绝服务攻击(Denial of Service,DoS),尤其是分布式拒绝服务攻击(Distributed DoS,DDoS)已经成为最严重的网络安全威胁之一。由于TCP/IP协议设计之初的缺陷和因特网的开放性
网络信息发布系统是指在Internet上进行信息发布的信息系统,其特征是利用Internet的技术传输和处理信息。以数字化、网络化、智能化为特征的多媒体信息发布系统己越来越受到
随着计算机技术及人工智能的飞速发展和中国教育信息化水平的不断提高,实现考试的无纸化、网络化成为IT界和教育界关注的热点。随着经济和社会的发展和终身教育观念的普及,迫
随着机场信息化程度的不断提高,在当今大型机场的资源管理系统中,实时准确的机场业务监控系统、多主机共享的到离港控制系统、实时更新的机场运营数据库服务器、复用性强的资源
粒子群优化算法(Particle Swarm Optimization,PSO)经过十多年的研究与发展,已经成为科学研究和工程实践中重要的全局优化和复杂问题求解技术,PSO的应用几乎渗透到了任何领域,