多预测子融合实时连续语音识别输出词正误判别

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:fishe1042
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在采用堆栈译码词网重估输出作为识别最终输出的连续语音识别实时解码条件下,利用决策树方法将多个预测子融合,对识别输出词进行正确和错误的判别.本文首先构造了词后验概率、词长、相邻词的后验概率、词的声学和语言得分等共13个预测子,然后利用决策树方法,通过选择不同的预测子组合方式和适当的决策树建树参数,筛选出预测子的最佳组合,建立优化的决策树进行输出词的正误判别.实验结果表明:利用局域词图计算的词后验概率与词长、相邻词的后验概率等几种实时预测子融合后,对识别输出词的正误判别能力得到提高,并且在实时性和分类效果
其他文献
本文针对汉语中所有声韵母发音序列中的连续口型提出了一种口型分类的思路。在建立了覆盖所有声韵母的汉语双模态语料库的基础之上 ,本文提出了一种两次分类的方法 ,对语料库中的图像进行唇的分割、定位及特征提取 ,并依靠选择的特征 ,将声韵母的发音序列中的口型聚为 15类。本文的目的是在此分类的基础上 ,明确唇读识别阶段的状态数 ,减小搜索的空间 ,提高收敛速度
"2009年,金融危机的身影犹在,复苏曙光已经闪现。2010的脚步渐渐接近,全球经济是反弹后的昙花一现还是真正复苏?世界经济前景仍不明朗,中国经济将面临着怎样的考验?后危机时代,
农产品需求增长和需求结构变化的不确定性都在显著增加近年来,随着人口增长和城乡居民收入、消费水平的提高,农产品消费需求不断扩张。与此同时,随着世界范围产业结构和消费结构
2008年春节前夕,当第一场大雪降落到南方的几个省份时,相信几乎所有人都是欣喜的,记者在南京的朋友还兴奋地发来精心堆制的雪人的照片。但是,当暴雪、冻雨一场接着一场跟来,便逐渐
《能源法》(征求意见稿)于2007年12月3日起公开向社会广泛征集意见和建议,征求意见活动计划至2008年2月1日结束。至此,能源法起草周期已历时两年。随着中国经济决速增长,日益严峻
本文通过重构语音信号相空间。研究语音的相似序列重复度及其熵信息 ,分析比较了语音信号在相空间中的非线性特征。根据清音和浊音在多维相空间中的不同空间分布特性 ,对语音音素进行了分类。利用语音信号在相空间中的非线性特征可以为语音识别研究提供一个新的方向
全世界都在关心失衡问题,也许是关注的角度不同,有人更多地将失衡看做是美国问题;有人更多地将失衡看做是亚洲问题。有点像盲人摸大象。还有一些非常悲观的担忧,比如,失衡将导致世界经济出现崩溃性调整等。本文想说明,第一,失衡是世界各国面对的共同挑战;第二,在全球化提供的更广阔的平台上,失衡表现为一种动态均衡。    消费、投资、储蓄失衡    世界经济失衡表现为美国等发达国家的经常项目逆差,以及亚洲等发展