论文部分内容阅读
信息时代的到来,使得计算机成为人类生活中重要的工具,为了更加友好地实现人机交互,让计算机也能“听懂”人类的语言,语音识别技术便应运而生。语音关键词检出技术是语音识别的一个重要研究领域,它是从连续的、无限制的自然语音流中识别出一组给定词的语音识别技术。关键词检出技术可以应用于一些具有特定要求的场合,同时具有速度快、高检出率和实用性强等特点,所以具有广阔的应用前景和很好的研究价值。同时,为了提高识别系统的整体性能,对识别结果的确认也是非常重要的,因此有关语音置信度方面的研究也就尤其必要。本文主要对关键词检出技术及置信度问题进行了研究,具体的内容和贡献主要有以下两个方面:(1)介绍了关键词检出技术的过程和原理,提出了一种新的检索算法即Lattice-T算法,该算法是基于词图(Lattice)结构进行的检出算法,把需要检出的关键词用树来存储,通过词图上的节点反过来检索树上的关键词,这样遍历一遍图就可以完成检索任务。相比于传统的基于N-Best结构的关键词检出方法,该方法检出率提高了12.22%,检出的时间效率提高了11.58%,性能得到了提高。(2)介绍了支持向量机(SVM)的相关知识,并利用SVM来求解置信度,讨论了此方法需要解决的一些问题:SVM概率化输出问题、SVM置信度综合问题等。通过和算术平均方法来进行置信度综合的效果相比较,利用SVM得到的置信度,在相同拒识率情况下得到更高的识别率,较算术平均方法在每个拒识率下识别率有大约7%的提高,识别的整体性能增强。本文构建了一个基于中国电信114服务中心电话录音的关键词检出系统,该系统包括关键词检索模块、搜索结果查看功能模块、提交查询结果功能模块、并行检索模块、报表生成模块等。通过对这些模块的介绍和实现效果展示,可以更加直观地了解到关键词检出技术的实际应用。