子空间高斯混合模型在中文语音识别系统中的实现

被引量 : 15次 | 上传用户:ieuieuieu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
隐马尔可夫模型(Hidden Markov Model, HMM)一直作为语音识别系统声学建模的基本模型。由于其参数规模在考虑上下文发音的影响后急剧增长,在训练数据有限时模型参数无法被充分训练。本文引入一种基于子空间高斯混合模型(Subspace Gaussian Mixture Model, SGMM)的语音识别方法。区别于传统的HMM框架每个状态均关联若干个均值方差参数来计算输出概率,子空间高斯混合模型的每个状态只关联一个低维的映射向量,其均值和方差通过所有状态共享的映射矩阵计算得到。模型的参数规模因此大幅降低,从而在训练数据有限时,模型参数较传统HMM训练更充分。子空间高斯混合模型在英语,法语,以及西班牙语中已经被证实有效,在本文之前还尚未进行过中文测试。本文运用空间高斯混合模型的思想,成功搭建了中文的子空间高斯混合模型语音识别系统,主要完成的工作有:1)搭建子空间高斯混合模型语音识别系统。配置运行环境以及编译源代码,整理训练和测试数据,设计和实现模型训练和解码的脚本程序。2)训练和测试中文子空间高斯混合模型。训练单音子HMM,以及在此模型的基础上进行了一系列模型优化措施,其中包括:三音子模型训练,线性特征转换,区分性训练以及发音人自适应,并通过这些模型得到子空间高斯混合模型,最后对模型进行测试。测试结果中子空间高斯混合模型在有限的语音训练数据条件下能够使得词错误率(word error rate, WER)相比较传统隐马尔可夫模型有6.44%的绝对降低(23.43%降至16.82%)以及28%的相对降低。测试结果表明:子空间高斯混合模型框架的确能够有效提升中文语音识别率;并且现有的优化算法,如模型细化、特征优化、区分性训练、发音人自适应等,在该模型框架下依然有效。
其他文献
日本近代文学大家谷崎润一郎,被誉为日本唯美主义大师。其作品从明治43年发表的蜚声文坛之作《刺青》到1965年去世的绝笔《恶语》《七十九岁的春天》,横跨明治、大正、昭和三
新时期的档案管理工作结合价值影响需求、顺应社会时代发展需求,做好电子信息档案管理系统建设,提升档案应用价值是十分关键的。显然传统的档案管理工作已经不能满足社会发展
以“争议岛屿”归属和海洋划界为主要争端的南海问题,是关乎我国与南海周边国家关系的敏感问题。提供中国对南海“争议岛屿”拥有主权的依据,加强中国对南海“争议岛屿”附近
目的防止射线对医护人员、患者及公众造成危害,确保放射工作人员的健康,提高医疗诊断质量。方法按照国家有关法规、标准,采取以基础管理为主,定期教育、检测为辅,归档分类总
电子白板系统改变了传统的教学模式,运用当代的多媒体和显示技术,具有功能丰富、操作简单等优点;嵌入式技术是将先进的计算机技术、半导体技术和电子技术与各个行业的具体应用
小班幼儿,这就意味着他是第一次较长时间与亲人分离,进入到一个新的陌生环境与许多陌生的面孔在一起吃饭、睡觉、玩耍、学习把这一时期说成是幼儿心理发展的一大转折点一点都不
随着我国经济体制的发展,我国高等教育教育制度由精英教育向大众化教育转轨和发展,随着教育模式的转变,大学生的就业分配制度也随之发生了很大的转变。由最初的统一分配逐渐过渡
目的 了解当前郑州市外伤后破伤风预防用药的现状。方法 对参加郑州市急救医师复训会议的执业医师312人,通过自行设计的调查问卷,了解郑州市目前外伤后破伤风预防用药的现状,
穿越多年冻土区的青藏铁路,因冻土的热稳定性较差,土体的冻胀和融沉常诱发多年冻土区工程构筑物的破坏。青藏铁路建设阶段,路基的防排水工程主要采取了预制的U形槽、梯形槽及
摘要:当今知识经济迅猛发展,知识产权已经成为国家和企业竞争的焦点,专利作为知识产权的核心内容,成为国家和企业制定发展战略不可忽视的重要内容。但是近年来,在经济快速发展