【摘 要】
:
随着大规模连续语音识别的广泛应用,语音的置信度在语音识别技术中发挥了越来越重要的作用。本文对于目前的基于网格的语音识别置信度算法进行了总结和改进,并将改进后的方法
论文部分内容阅读
随着大规模连续语音识别的广泛应用,语音的置信度在语音识别技术中发挥了越来越重要的作用。本文对于目前的基于网格的语音识别置信度算法进行了总结和改进,并将改进后的方法应用于脚本确认系统的实现中。
本文对于语音的置信度的研究和创新主要包含两个方面,一方面是如何计算每段语音的基本单位--音素的置信度,另一方面是如何从音素的置信度得到词一级甚至句子一级的置信度。
对于音素的置信度计算方面,本文利用对于网格的统计得到易混音素对(Confusable Pairs, CP),在原有基于模板的通用后验概率算法(Template Constrained Generalized Posterior Probability, TCGPP)基础上对其加以改进;同时设计出一种选取相对阈值的方法来设计模板。实验证明,由于这种改进同时考虑到了语言模型和声学模型的特性,比原有方法具有更好的效果;而选取相对阈值的方法设计模板要比绝对阈值方法具有更好的效果。此外,本文也分析了TCGPP算法以及使用易混音素对改进后的TCGPP算法的局限性,通过实验表明它们仍然受到声学模型质量的限制。
对于通过音素级置信度来计算句子置信度方面,本文独创性的引进一种投票排序的算法,在统计意义上得出句子级的置信度结果,使得音素级置信度信息得到更加充分的利用。因此该方法在实践中具有很高的实用性。
本文将改进后的置信度算法和投票排序方法加以应用,实现了脚本确认系统。该系统用于在语音数据库的录制过程中,自动检测录音内容与对应的脚本的一致性。现被微软中国研发集团商务软件部语音合成组用于数据库的建立,目前在多种语言上运行效果良好。
其他文献
TeXCP算法是Sigcomm05上提出的一种用于MPLS网络中的在线负载平衡算法。该算法具有控制论上的稳定性,能适应业务变化自动调整到新的平衡点,与其它的在线负载平衡算法相比,该
在P2P—SIP电话模型中,通话质量极大地限制了系统的推广应用。传统改善通话质量的方式一般集中在对传输协议层的改进,这些方式增加了传输协议的复杂度,降低了信息交互的速度。本
无线传感器网络作为一种全新的信息获取和处理技术,应用领域广泛,如外部目标的定位和追踪,为网络提供命名空间,报告网络的覆盖质量,实现网络拓扑的自配置等,而网络自身定位是
滴丸是中药的一个重要品种,在中药企业中占有很重要的地位。在滴丸企业的实际生产中,为了判断生产工艺是否合格和稳定,同时为了进一步改进生产工艺,往往需要对滴丸生产的全过程的
网格系统是共享因特网上分布式资源进行合作的新形式,GT4(Globus Toolkit 4)是一种被广泛接受的网格技术解决方案。信息服务是网格服务系统中的一个重要组成部分,而其在GT4的
随着互联网和电子商务的飞速发展,互联网为用户提供越来越多的信息和服务,用户在得到便利的同时也不得不面临大量的垃圾信息和无意义数据,即所谓的信息超载问题。面对海量的网络
现代信息技术的发展为教育信息化提供了新的工具和手段。然而,在教育信息化的过程中,信息孤岛现象日益严重,各业务系统间逐步构成了一个庞大的异构环境。而且,大量信息重复出
新型可字节寻址的非易失性存储器(NVM),例如相变存储器(Phase Change Memory,PCM)在低能耗、高密度、就地更新数据等方面拥有很多的优点,但是由于NVM具有读写不对称性特点,即
大数据时代的到来,对人们的生产、生活以及工作和思维都产生着巨大的影响。在海量数据面前,如何将其转换为有价值的信息和知识,是当前一个十分重要且有意义的课题。通过对数
为了解决指令集兼容问题,以及提高程序的执行速度,研究人员开发了跨指令集虚拟机系统、动态二进制翻译系统、动态二进制优化系统以及一些模拟器系统。代码缓存管理是上述系统设