DDBHMM语音识别模型的训练和识别算法

来源 :清华大学 | 被引量 : 0次 | 上传用户:xiaxia28
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对语音识别中非齐次HMM模型的研究还是一个难题的情况,对语音段长模型中具有代表性的VDHMM模型、ESHMM模型、SM模型和DDBHMM等模型进行了深入的探讨。通过论述DDBHMM理论框架模型,重点研究了非齐次HMM模型的段长等效表示方法。 在非齐次的HMM模型中,状态转移是一个有后效的过程,用于齐次HMM模型训练和识别的Baum-Welch算法不再适用,必须寻找新的非齐次HMM模型的训练算法。本文针对DDBHMM模型的特点,使用状态段长分布来表示非齐次Markov模型,提出了新的Forward-Backward快速算法,并构造出了DDBHMM模型的最大似然训练和识别算法,进一步充实了DDBHMM模型理论和算法框架。最大似然训练和识别算法,能够在似然函数统计意义上利用所有的信息,是这种统计意义上的最佳训练和识别方法。文中提出的DDBHMM模型最大似然训练和识别算法,在实现过程中无需假设语音特征帧间独立,可以在DDBHMM模型中充分地利用语音的段长信息和特征的时间相关性信息,能显著地提高语音识别系统的性能。 本文将所提出的DDBHMM模型训练和识别算法应用于在语音识别系统中,进行了语音段长信息和特征时间相关性应用的研究。在仅增加使用段长信息的条件下,非特定人孤立字语音识别正确率达到90.54%,较经典HMM模型的正确率提高了0.71%,错误率下降了6.9%。在非特定人连续语音识别中,声学层的语音识别错误率较经典的HMM模型下降了17.4%。在DDBHMM模型中使用了线性预测器来描述语音特征的帧间相关性后,更可以使误识率下降了41.1%。实验结果表明了模型和算法的有效性。
其他文献
在庄严肃穆的南京雨花台革命烈士陵园里,埋葬着一位出生于潍坊的红色传奇“间谍”.他三次被敌人逮捕坐牢,两次在革命队伍内受委屈,却仍勇敢、坚定、机智、沉着面对,出色地完
期刊
超分辨率(Super-Resolution,SR)图像重建是目前信号处理领域中最为活跃的研究方向之一,它通过对多幅具有相对运动的低分辨率(Low-Resolution,LR)图像进行处理,在融合低频信息
本文主要研究了OFDM信号智能接收技术。首先提出了一种基于软件无线电的OFDM信号智能接收机工作模型,该模型可以实现OFDM信号的自动识别和参数估计功能。接着对该智能接收机
该文研究了电话语音的声学特性.电话语音中存在着来自用户端环境噪声、用户端话筒设备产生的线性和非线性失真、电话信道中电子噪声、电话信道中线性和非线性失真等对语音识
高阶统计量分析是近些年国内外统计信号处理领域内的一个前沿课题.它被广泛应用于所有需要考虑非高斯特性、非最小相位、有色噪声、非线性或循环平稳性的各类问题中,目前已在
模糊集理论在过去十年中已经获得广泛应用.模糊技术可以容忍不精确性和不确定性,可以将其启发式的推理结合到传统的处理方法中.在图像处理、模式识别和计算机视觉中,模糊逻辑
本文以汕优63(籼稻)和武运粳7号(粳稻)为材料,研究了1,2,4-三氯苯(TCB)和萘(NAP)对水稻生长发育产生伤害的机理及水稻的耐性机制。结果如下: 1 TCB和NAP对水稻的伤害现象分析 0~80mg/L的TCB和NAP对水稻种子发芽率没有显著影响;TCB和NAP抑制水稻幼苗的生长发育,且随其浓度的增高抑制程度逐渐增大,具体表现为:TCB和NAP导致水稻苗高降低,根长变短,根数
潍坊是“中国摄影之乡”.潍坊历史文化底蕴深厚,名胜古迹众多,摄影资源优质丰富,摄影群体庞大,有专业的摄影队伍和摄影人才,张景国就是其中一位优秀代表.他用镜头直观、震撼
期刊
本文重点叙述了基于“龙芯”CPU的高性能安全服务器主板(GSMB)的设计与研究。通过对“龙芯1号”(Godson)CPU微体系结构定型的讨论和关于“龙芯1号”CPU所需达到的的性能指标
李敖(1935-2018)字敖之,中国台湾著名作家,历史学家,诗人,其文学作品以强烈的现实主义批评性著称.2010年出版《李敖大全集》共收录作品达1400余万字,以自叙散文和政论杂文为
期刊