论文部分内容阅读
在普通话连续数字串的识别中,与传统HMM在持续时间模型上的错误假设有关的删除与插入错误所占比例可达24.23%。基于此,在Viterbi解码中引入持续时间模型信息。对多种带参函数分布的持续时间模型在理论和实验上的比较分析都证明了Gamma分布更能精确反映汉语字模型的持续时间特性。文中还在外惩罚模型的基础上提出预理分段内惩罚持续时间模型和全局内惩罚持续时间模型两种改进算法。实验表明,结合持续时间模型的语音识别算法可以有效地减少删除与插入错误率,使总体识别错误率比基带系统减少了47.74%。