【摘 要】
:
自动语音识别技术在当代人们的生活中有了越来越广泛的应用。目前自动语音识别又大致分为连续语音识别和关键词识别。相对于连续语音识别,关键词识别在提高系统对话自然度方
论文部分内容阅读
自动语音识别技术在当代人们的生活中有了越来越广泛的应用。目前自动语音识别又大致分为连续语音识别和关键词识别。相对于连续语音识别,关键词识别在提高系统对话自然度方面更有优势,因为它的特点是通过捕捉用户说话中包含重要信息的关键词而不是必须完全正确地识别出一句话中的每个词来理解其意。这对于在自然对话情景下口语的不规范、不连贯等问题也是一种很好的解决方案。在自动语音识别中,当训练语音和识别语音有较大差别时,将导致系统的识别率急剧下降。自适应技术就是利用少量的被测试人的语音调整系统参数,来缩小系统模型与被测试人之间的差距,提高识别率。本文主要目的是对说话人自适应技术和说话人归一化技术在关键词识别系统中的应用进行研究和探讨。研究的主要内容包括:1.基于连续隐马尔可夫模型(CHMM)框架的非特定人关键词识别基线系统的构建。探讨了构建此系统所涉及到语音预处理、特征参数提取、声学层模型的建立与训练、关键词检出、关键词确认等内容。并对基线系统进行了评价,提出了在基线系统中加入自适应模块的必要性。2.研究了说话人自适应技术和说话人归一化技术,并提出了将两种技术相结合的思想。实验表明在训练时加入说话人归一化技术,可以使训练得到的模型更具有说话人无关性,在此基础上进行自适应时能达到更高的识别率。在实验中对几种说话人归一化方法与自适应方法相结合的情况进行了比较和验证,并选择了说话人归一化方法中的说话人自适应训练方法(SAT)与受约束的最大似然线性回归(CMLLR)相结合的方案。3.结合构建的关键词基线系统,实现了一个面向股票信息查询的交互式语音查询系统,在系统中加入了说话人自适应模块,实现了两种自适应方案。最后对系统进行了评价,验证了本文探讨的自适应技术和说话人归一化技术的有效性。
其他文献
鄂温克族自治旗是以鄂温克族为主体的少数民族自治旗,巴彦托海镇是其政府所在地,笔者通过对鄂温克族音乐在巴彦托海镇内的高中、初中和小学发展状况的调查与分析,提出了一些自己
在中国绘画的历史中,明代绘画艺术占有极为重要的地位。明代绘画艺术的总体格局,表现为积极变革但发展缓慢,流派纷呈且理论活跃。
<正>1931年江淮大水,"灾祲之后,疫疠蔓延,灾黎死亡枕藉"。据金陵大学农业经济系所作的调查,在受灾的2520万人中,17%患有各种疾病,其中热病占6%,腹泻占5%,其他疾病占6%;自水灾
建筑物防雷是个系统工程,防雷设计应充分考虑接闪功能、系统影响、屏蔽作用、均衡电位、接地效果以及合理布线等。本文对高层住宅屋面避雷网格及屋面避雷带的敷设作了较详尽
本文对铜锌母体及氧化铝载体的制备方法进行了探索研究。实验结果显示:新方法制备的母体呈现较多的(Cu,Zn)2CO3(OH)2晶相,其样品表面的Cu/Zn比值较高,使催化剂样品分别提高活
近年来我国日趋严重的有效需求不足问题已经成为制约经济健康发展的根本障碍,更为严重的是一些对症下药的经济调整政策也收效甚微。有研究认为,我国目前不完善的社会保障制度是
目的调查分析维持性血液透析(MHD)患者高血压治疗现状及相关危险因素。方法对南京市5所三级甲等医院297例MHD合并高血压患者的有关临床资料进行调查,用多因素Logistic回归分
<正>Klotho基因是Kuro[1]等于1997年发现的与衰老有关的新基因,并用古希腊神话中纺织生命之线女神的名字命名。Klotho基因被敲除的小鼠(kl-/-小鼠)可出现类似人类衰老的各种
<正>在下基层学校教学调研的过程中,我了解到语文教师普遍不太重视学生作业设计这一环节,不少语文教师缺少作业设计的方法和能力,也有的教师贪图省力,懒得动脑筋设计,以致学
2003年以来,中国电视媒体格局发生了深刻的变化。随着省级卫视的崛起和央视的频频改版,中国电视业逐渐打破了以往“央视为主,一家为大”的旧电视格局,并逐渐从“条条”行政管理格