语音识别技术的关键问题研究

来源 :陕西师范大学 | 被引量 : 0次 | 上传用户:fuzhuyuansu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球一体化的不断发展,国家和区域之间的经济贸易交流越来越多,同时个体的活动范围也正不断的从本地走向世界,然而语言的交流却成为阻碍发展的一大障碍。计算机技术和信息技术的不断发展使得计算机作为辅助人类交流的中间工具正迅速的发展起来,如何利用新的技术使得交流从复杂到简单,从抽象到通俗成为人们所关心的问题。语音识别(Speech Recognition)是模式识别技术的一个重要分支,它以语音信号为研究对象,以实现人机交互的目的,主要研究包括计算机技术、信号处理、模式识别语言学等多个领域的一门交叉学科。在最近的几十年内语音识别成为人和机器,人和人之间流畅沟通的重要桥梁。虽然语音识别技术在各行各业的使用范围已经非常广泛,识别的质量和识别效率也有很大的提高,但由于语音的人为因素、环境因素和语音识别算法等众多因素的制约,完全100%的识别目前仍是不可能达到的。本文从影响语音识别的内外部因素出发,研究语音识别技术的关键技术和问题并探讨如何提高语音识别的识别率。第一部分从影响语音识别的人为因素出发对影响识别准确率的样本采集方面进行分析:语音识别的对象是不同的个体所发出来的信号源,因而个体的多样性和特殊性就决定了同样的一句话就会有不同的信号输入。本文从个体的地域特征、个人的性别和生理特征以及个体的说话方式情感表达等的不同角度来分析人为因素对语音识别的影响。第二部分从外界环境对语音信号采集的影响进行深入探讨:语音信号从发音者发出来之后被语音识别设备所采集,在此过程中也存在着不定的外界因素,如信号采集过程的设备噪音、采集环境下的偶发噪音等外界因素对信号的采集有很大的影响,这些影响会直接导致语音信号训练和识别结果的不正确。第三部分从语音识别过程的算法和识别模型方法的角度探讨目前流行的各种算法和技术方法。在语音识别过程中有很多种算法,在信号处理的前期阶段关键方法和算法主要有:语音信号的预加重、语音信号的加窗处理、短时平均能量、短时平均幅度函数、短时过零率、短时自相关的分析、短时能量和零差分端点检测算法等。在语音识别中,特征参数的提取是识别准确率高低的一个重要部分,特征参数的好坏取决于能否完全表达信号所有信息的指标。目前流行的特征参数方法有线性预测系数(LPC)、线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC)等。识别模型方法是语音识别技术的另一个重要环节:其主要有动态时间规整(DTW)、隐马尔科夫模型(HMM)、矢量量化(VQ)等。本文通过设计语音识别系统对大噪音环境的语音信号的使用滤波的噪音处理方法,并以MFCC作为特征参数,使用VQ和HMM两种识别模型来分别观察实验结果分析语音识别效果。
其他文献
俗语说:“没有规矩,无以成方圆”,可见规矩的重要性。可教育的对象是人,是有着丰富而复杂情感的人,所以仅凭条条框框、规章制度,框住的往往是学生的人,而不是心,弄不好,反而会引发学生
产业集群日益成为区域经济的重要组成部分,如何发挥地方政府在这一特定领域中经济职能,成为地方政府促进产业集群发展中要解决的重要课题。尤其是在经济水平较为不发达的中部地
朋友去美国多年,她的父母去看她,在那儿住了10个月,回来后谈了很多.因为都是教师,自然最关心孩子的教育问题。姥姥、姥爷在美10个月,总共去丁孩子所在的幼儿园三次。第一次是刚到后
目的:研究Wnt-1蛋白与Sfrp-1蛋白在宫腔粘连患者子宫内膜中的表达情况,初步探讨其与宫腔粘连的相关性。方法:采用免疫组织化学(IHC)方法,检测60例宫腔粘连(Intrauterin adhesio
我的孩子今年已经三岁了,聪明、机灵、可爱,最重要的是独立意识很强。
期刊
虽然教育部对小学生作业量有明确要求,学校,教师也对学生的课外作业量加强了控制。但就目前来看,学生的课业负担并没有减轻,学生学得也并不轻松。
活用字词就是让学生根据随机获得的一组互不关联的字词,异型大胆合理的想象,在3分钟内趣编故事并现场口头表达出来。它经历了字词一句一段一篇的全过程,将学生的创造能力和口头
在对提升教育质量的期望日趋殷切的今天,人们对卓越教师的需求日渐强烈,卓越教师是教育领导的人才库,是促进教育改革、改善教育实践的中坚力量,培养卓越教师关涉师资队伍的建设和
摘要:随着公司治理理论的不断发展和完善,股权结构已成为公司治理的根本问题,越来越多的公司把其作为衡量公司价值的一个重要指标,以衡量公司经营、公司监管的绩效。但是现有