语音关键词检出技术及置信度问题研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:pipi783
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代的到来,使得计算机成为人类生活中重要的工具,为了更加友好地实现人机交互,让计算机也能“听懂”人类的语言,语音识别技术便应运而生。语音关键词检出技术是语音识别的一个重要研究领域,它是从连续的、无限制的自然语音流中识别出一组给定词的语音识别技术。关键词检出技术可以应用于一些具有特定要求的场合,同时具有速度快、高检出率和实用性强等特点,所以具有广阔的应用前景和很好的研究价值。同时,为了提高识别系统的整体性能,对识别结果的确认也是非常重要的,因此有关语音置信度方面的研究也就尤其必要。本文主要对关键词检出技术及置信度问题进行了研究,具体的内容和贡献主要有以下两个方面:(1)介绍了关键词检出技术的过程和原理,提出了一种新的检索算法即Lattice-T算法,该算法是基于词图(Lattice)结构进行的检出算法,把需要检出的关键词用树来存储,通过词图上的节点反过来检索树上的关键词,这样遍历一遍图就可以完成检索任务。相比于传统的基于N-Best结构的关键词检出方法,该方法检出率提高了12.22%,检出的时间效率提高了11.58%,性能得到了提高。(2)介绍了支持向量机(SVM)的相关知识,并利用SVM来求解置信度,讨论了此方法需要解决的一些问题:SVM概率化输出问题、SVM置信度综合问题等。通过和算术平均方法来进行置信度综合的效果相比较,利用SVM得到的置信度,在相同拒识率情况下得到更高的识别率,较算术平均方法在每个拒识率下识别率有大约7%的提高,识别的整体性能增强。本文构建了一个基于中国电信114服务中心电话录音的关键词检出系统,该系统包括关键词检索模块、搜索结果查看功能模块、提交查询结果功能模块、并行检索模块、报表生成模块等。通过对这些模块的介绍和实现效果展示,可以更加直观地了解到关键词检出技术的实际应用。
其他文献
布尔函数在现代密码体制中扮演了一个重要角色,它的设计优劣影响着整个密码系统的安全性。随着近年来,代数攻击和快速代数攻击等密码分析手段日趋成熟,设计抵抗代数攻击的布尔函
伴随着互联网的兴起,同时各种各样的网络攻击也在困扰着互联网的用户。随着互联网技术的革新和网络覆盖率的快速增长,攻击手段也日益趋向多样化和复杂化,其中尤其以拒绝服务
流媒体点播对网络带宽要求很高,在传统基于C/S的模型中,当用户数量大规模增长时,该模型由于网络带宽不足难以保证系统的服务质量。而在P2P网络模型中,节点之间直接可以交互信
指纹识别是目前最为普及的一种基于生物特征的身份认证方式。自动指纹识别技术已经取得了许多研究成果,并获得了广泛应用,但其识别率仍然远低于人工指纹识别,制约了指纹识别
由于人的生理特征具有便于携带、不丢失、不易仿制、复杂度高等特点,生物特征识别技术已成为信息社会身份认证的主要手段之一,指纹识别技术更是使用最早和最为广泛的生物特征
支持向量机是Vapnik等人于1995年在统计学习理论基础上提出的一种模式识别算法,其根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折中,以求获得最好的推广能力。而核
群集生物行为的研究是人工生命学领域的研究重点和热点之一,而其仿真模型在电影动画制作、生物学研究以及军事信息化领域都有广泛的应用。本文所提出的鸟群基于不同生物特性的
随着我国车辆保有量的激增,开车堵和停车难问题在城市显得尤为突出,根据调研数据[1]分析我国城市平均1辆车对应0.3到0.4个停车位,而欧美平均值为1.2到1.5个停车位,在停车位大大少
随着分布式技术的发展,特别是在Internet成为主流软件运行环境之后,网络的开放性和动态性使得软件的变化性和复杂性进一步增强。同时,对于一些实时和长期运行的关键任务系统
随着教育规模的持续扩大,学生数量急剧增加,给学生管理工作带来很大压力,单纯的学生信息管理系统信息化远远不能满足需求,由此提出了数字化校园的建设目标,即以网络为基础,利