基于混淆网络和辅助信息的语音识别技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：liutingkaoyanhao

【摘要】

：

通过语音与机器进行自由交流是人们多年以来的梦想。经过几十年的不懈努力,语音识别技术已获得了巨大进步,但仍难以满足实际应用的需要。如何进一步提高语音识别性能及其稳健

【作者】

：

王欢良

【出处】

：

哈尔滨工业大学

【发表日期】

：

2007年期

【关键词】

：

语音识别混淆网络辅助信息多系统融合声调建模

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

通过语音与机器进行自由交流是人们多年以来的梦想。经过几十年的不懈努力,语音识别技术已获得了巨大进步,但仍难以满足实际应用的需要。如何进一步提高语音识别性能及其稳健性(Robustness)成为当前语音识别技术发展的瓶颈。人类在语音辨识过程中潜在地利用了众多信息源,而当前基于计算机的语音识别系统通常只利用了非常有限的声学和语言学信息,如语音的谱特征和N-gram统计语言模型。对于语音识别这种复杂任务来说,这些主要信息是远远不够的。有效地建模和应用其它辅助信息将有助于提高语音识别性能。混淆网络是多候选识别结果的一种紧凑表示形式,基于混淆网络解码可以最小化词错误率。基于混淆网络来融合辅助信息进行解码是提高识别性能的一个有效途径。本论文主要从混淆网络和辅助信息两个方面研究了改善语音识别性能的方法。在混淆网络方面,主要研究了混淆网络的高效构造方法和融合辅助信息的解码方法。在辅助信息方面,主要研究了几种重要辅助信息的有效建模和应用方法。本论文的主要研究内容和创新点具体如下:1.提出了两种高质量混淆网络的快速构造方法。一种方法通过对Lattice结构进行分段来降低混淆网络构造方法的计算规模,提高了混淆网络的生成速度,而其质量只有轻微下降。另一种方法利用具有最大后验概率的转移弧来指导混淆集合的构造,使算法复杂度降为线性。为了提高了生成混淆网络的质量,提出了基于K-L散度的弧相似性测度方法。最后,针对汉语语音识别任务,给出两种新的混淆网络结构:汉字混淆网络和逻辑混淆网络。2.提出了两类辅助信息的建模方法和应用于混淆网络的解码方法。为了利用词间的长距离依赖信息,提出了基于词义类对触发式语言模型的混淆网络解码方法。为了利用更多的辅助信息源,提出了基于多系统结果融合的混淆网络解码方法。实验结果显示两种方法可以使汉字错误率分别相对下降7.9%和10.7%。3.提出了利用声调辅助信息来改善汉语音识别性能的方法。在声学解码阶段,提出采用基于多空间分布的隐马尔可夫模型来对声调进行建模,解决了其特征不连续的问题。在双数据流隐马尔可夫模型框架下,对谱特征和基频特征进行同步解码,可使汉字错误率相对下降15.9%。在第二遍解码阶段,提出基于Supra-tone单元的独立声调建模方法。利用Supra-tone声调模型进行混淆网络解码,进一步使汉字错误率相对下降8.0%。4.开发了一个具有输入错误在线快速修正功能的汉语语音输入系统。通过利用汉字混淆网络,可以把句子级候选分解为汉字级候选,从而使用户能够利用候选快捷地修正近一半的识别错误。为了快速可靠地输入新的汉字,提出手写信息辅助的孤立汉字语音输入方法。这种方法具有比手写输入更快的速度,并且比单纯的语音输入更为可靠。综上所述,本文通过对混淆网络和辅助信息的研究提高了语音识别的性能和实用性。混淆网络的高效生成方法对于其它任务(如语音文档检索等)也会有很大帮助。采用触发语言模型和多系统结果合并的混淆网络解码方法为有效利用其它类型辅助信息提供了有益借鉴。对声调辅助信息的研究是充分利用声学辅助信息(如重音、语调等)的一个很好开端。利用混淆网络和手写辅助信息使语音输入错误的修正更为快捷可靠,这是辅助信息和混淆网络在语音识别任务中的一个成功应用。

其他文献

报业数字化难点与解决方案研究——河北日报报业集团数字媒体建设实践案例分析

<正>河北日报报业集团按照"数字化引领,结构化升级"的思路,根据自身发展实际,整体谋划,战略布局,积极整合内部资源,大力推进数字媒体建设,积极推进实施战略转型,

期刊

河北日报报业集团报业数字化数字媒体案例分析

基于初中语文教材的作文教学策略研究

现阶段,为呼应素质教育新课改的要求,各学科老师都在努力转化教学思想,改进课程教学模式,提高教学质量。然而,在初中语文教学过程中,基于初中语文教材而进行作文教学的方式也

期刊

初中语文教材作文教学策略探究

医方视角下我国医患纠纷的解决机制研究

从医方的视角出发,利用成本-收益分析法探究我国医患矛盾发生的因素和解决机制。研究发现,当医生对患者实施过度医疗后的基本工资和额外收益之和大于其因过度医疗行为而面临

期刊

医患矛盾成本-收益分析法第三方机制诚信评估

角色榜样令人生不安

维斯塔去世后，杰里感到自己必须做件事，最后决定参加一个黑人的葬礼。他在报纸上找了一则启事，开车赶到教堂。在仪式中，当朋友们逐个向死去的女人倾诉哀思的时候，杰里站了起来，向死

期刊

人生榜样保险工作收款人客户威士忌办公室葬礼

天然矿物材料沸石在水处理中应用研究的新进展

沸石是一种架状结构的硅铝酸盐天然矿物材料，内部含有许多孔穴与通道，具有离子交换、高效选择性吸附及催化等优异的物化性能和良好的环境属性，在水处理研究与实践中得到高度关注

期刊

天然沸石催化作用互补作用水处理

扎根施工一线的“老黄牛”--记中铁七局集团路桥公司特级技师南智学

身上穿着洗得有些褪色的工作服,脚上穿的是一双黄胶鞋,密实的黑短发里掺杂些许白发,现场就是他心里时刻惦念的“家”。说起中铁七局集团路桥公司特级技师南智学,大伙都说他是

期刊

路桥公司技术能手施工一线能工巧匠工作服技师集团

城市轨道交通车站客流应急疏散时间影响要素分析

通过对北京地铁四惠站的现场以及客流调研，同时利用anylogic仿真平台的搭建对于地铁乘客应急疏散行为以及地铁车站的空间建筑形式对疏散时间的影响进行分析，总结疏散时间主要影

期刊

城市轨道交通疏散时间ANYLOGIC影响因素urban railway evacuation time anylogy impact factor

隧道里的缘分——记重庆轨道交通九号线指挥部总工程师卢智强

2018年12月,中建五局重庆轨道交通九号线指挥部的《卢氏拱盖法诞生记》情景剧在长沙演出。这部情景剧的内容源自重庆九号线卢智强“三创”工作室的工法创新,作为九号线的选送

期刊

中建五局情景剧扮演者重庆轨道交通诞生记总工程师

建筑工程施工现场的安全监督管理要点

本文分析了现阶段施工现场安全监督管理中存在的问题,发现安全监督管理普遍缺乏,施工现场管理不足,安全生产保障设施不足;忽视了施工现场的安全,缺乏工程建设计划。针对这些

期刊

建筑工程施工安全监督现场

互联网商务重返“部落经济”——从市场到集市——电子商务的商业逻辑

经过虚假的繁荣和出乎意料又在意中的大萧条之后，电子商务正在回暖，“电子商务之道”也逐渐显现，众多从事电子商务的企业之所以举步维艰，是因力它们只是把互联网当作一种新工具来

期刊

电子商务商业逻辑消费需求业务范围市场竞争力中国

基于混淆网络和辅助信息的语音识别技术研究

与本文相关的学术论文