统计声学模型的参数学习与结构选择方法研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:gaolch002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声学模型区分性训练是针对基于最大似然估计准则训练万法的模型假设与现实不匹配的问题而提出的,如今区分性训练已成为自动语音识别系统声学模型训练的一个必要模块。但是,当前主流的区分性训练方法仍然存在若干不足:一、推广性较差:在测试集与训练集不匹配的情况下,获得的性能提升非常有限。二、计算复杂度较高:当前主流的区分性训练方法通常需要对训练集做一遍语音识别以产生用作竞争空间的词网或音素网,计算量较大。三、缺乏对模型结构的优化:当前方法大多通过调整模型参数的方式来提高模型的区分性,而很少考虑对模型结构的优化。本文针对这三方面问题研究,并且在模型训练准则、竞争单元的选取和模型结构的优化等方面提出了一些新方法。  第一,提出了状态层的基于对手惩罚的声学模型区分性训练方法。该方法采用KL(Kullback—Leibler)散度来度量状态间的混淆程度,为每个状态创建候选竞争状态集作为竞争空间。利用强制对齐算法对每帧语音观察做状态标注,标注状态称为正确状态,同时从该状态的候选竞争状态集中选择似然最高的状态作为竞争状态,称为最强竞争状态。学习过程中对每帧的正确状态做增强学习,同时对其最强竞争状态做惩罚学习,以此来增强状态间的区分性。实验证明该方法性能优于基于最大似然估计的训练方法。在同样实验条件下与传统区分性训练方法的比较证明该方法有较好的推广性,特别是在测试集与训练集不匹配的情况下,效果尤为明显。同时,该方法无需对训练集做一遍语音识别,降低了训练的计算复杂度。  第二,提出了音素层的基于对手惩罚竞争学习的区分性训练方法。该方法将对训练数据一遍语音识别得到的音素网作为竞争空间。根据参考音素从竞争音素网中选择正确音素和最强竞争音素,学习过程中对正确音素做增强学习,同时对最强竞争音素做惩罚学习,以此来增强音素间的区分性。在同样实验条件下与传统区分性训练方法的比较证明该方法有较好的推广性。与本文提出的状态层的方法相比,通过引入长尺度单元的竞争,提高了在匹配测试集上的识别性能。  第三,提出了基于贝叶斯阴阳和谐学习的声学模型结构优化方法,提高了模型对语音的识别能力。一方面,该方法融合状态层的区分性训练方法与高斯混合层的自动模型选择方法,在优化模型状态间区分性的同时优化高斯混合模型结构。实验证明引入状态层区分性训练的模型选择方法优于未利用区分性信息的模型选择方法,同时得到的模型结构更加紧致。另一方面,该方法用于确定基于隐马尔可夫模型的建模单元的状态数,提高隐马尔可夫模型对时序语音的识别能力。实验证明与传统经验设置的方法相比该方法得到了较好的性能。  通过上述研究表明,声学模型训练过程中引入基于对手竞争惩罚学习的声学区分性训练方法和基于贝叶斯阴阳和谐学习的模型结构优化方法,有效的增强了声学模型的区分能力,提高了语音识别的性能。
其他文献
集成相干光通信系统,不仅具有相干光通信系统的高灵敏度()的优势,同时还具有体积小、成本低,热稳定性好、便于批量生产等光集成技术的优点。90°光混频器是相干光接收端的重
随着光通信技术的快速发展及应用,光网络中的业务更加多样化,特别是,波分复用(Wavelength Division Multiplexing,WDM)技术的日趋成熟为WDM网络承载多播业务提供了相应的技术
在干旱荒漠地区实施生态恢复与生态防护工程,使地表由流动沙丘变为固定的植被覆盖景观,地表覆被特征的变化,将改变原来的水分转化关系,直接影响区域的基本水文生态环境特征。沙坡
学位
绿洲-荒漠过渡带受绿洲生态系统与荒漠生态系统的双重影响,其植被稳定和环境良性发展对绿洲稳定起着至关重要的作用。前期调查表明,在黑河中游临泽绿洲-荒漠过渡带,沙拐枣(Calli
学位
白念珠菌是念珠菌病原体中最常见的一种条件性致病菌,由白念珠菌引起的感染逐年增多,受到国内外广泛的重视。白念珠菌应答的一个主要环境因素为细胞外的pH,这种应答反应是由保守
冗余字典下的压缩感知研究相对于经典的标准正交基而言具有更加广泛的现实意义。因此,冗余字典下的压缩感知研究一直是压缩感知领域研究的核心问题之一。在这种情形下,一种信
供水服务是生态系统服务中的一项非常重要的服务,它对人类生活和经济的发展起着支撑作用,但气候变化和人类活动极大地改变了生态系统的供水服务。黄土高原是一个严重受水分限
文本分类是语言信息处理的基础技术,广泛应用于信息检索、信息过滤等方面,同时信息处理需求的提升对文本分类技术的要求也越来越高。本文针对主流文本分类方法无法做到内容理
钙调素 (calmodulin,CaM) 是Ca信号转导系统中极其重要的组成部分,其功能通过与各种钙调素结合蛋白(calmodulin binding protein,CaMBP)的相互作用而实现。CaMBP-10 为本研究组
本文以黄瓜为材料,通过人工接种根结线虫卵的方法,对接种植株的多项生理指标以及根区土壤特性进行了系统的研究。 本研究包括两项盆栽实验。第一项盆栽实验于2006年2月~4月进