语音信号处理中的识别技术

来源 :科学与财富 | 被引量 : 0次 | 上传用户:oa001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:随着机器学习领域深度学习研究,以及大数据语料的积累,语音识别技术得到突飞猛进的发展,开始从实验室走向市场。语音识别技术已经逐渐进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。本文主要分析和总结了当前几种具有代表性的语音识别方法,介绍了其中关键的语音信号处理和语言模型建立的方法,最后总结了目前语音识别技术领域的研究成果及进展。
  关键词:语音识别;信号处理;机器学习;人工智能;概率统计
  1研究背景
  语音信号处理,主要包括三项技术,即语音识别、语音编码和语音合成。本文所研究的自动语音识别技术,就是让机器通过识别和理解把语音信号转变为相应的文本或命令的高技术。70年代,语音识别技术有了重大突破,动态时间规整技术基本成熟,使语音变得可以等长,另外,矢量量化和隐马尔科夫模型理论也不断完善,为之后语音识别的发展做了铺垫;80年代对语音识别的研究更为彻底,各种语音识别算法被提出,其中的突出成就包括HMM模型人工神经网络;目前许多国内外知名研究机构,如微软、讯飞、Google、IBM都积极开展对深度学习的研究。现在,国内有不少语音识别系统已研制成功。这些系统的性能各具特色——在孤立字大词汇量语音识别方面,最具代表性的要数92年清华大学电子工程系与中国电子器件公司合作研制成功的THED-919特定人语音识别与理解实时系统[4]  。
  2语音识别技术
  2.1  语音信号采集
  语音信号采集是语音信号处理的前提。语音通常通过话筒输入计算机。话筒将声波转换为电压信号,然后通过A/D装置(如声卡)进行采样,从而将连续的电压信号转换为计算机能够处理的数字信号。目前多媒体计算机已经非常普及,声卡、音箱、话筒等已是个人计算机的基本设备。其中声卡是计算机对语音信号进行加工的重要部件,它具有对信号滤波、放大、A/D和D/A转换等功能。而且,现代操作系统都附带录音软件,通过它可以驱动声卡采集语音信号并保存为语音文件。
  2.2  语音信号预处理
  语音信号号在采集后首先要进行滤波、A/D变换,预加重和端点检测等预处理,然后才能进入识别、合成、增强等实际应用。滤波的目的有两个:一是抑制输入信号中频率超出FS/2的所有分量(FS为采样频率),以防止混叠干扰;二是抑制50Hz的电源工频干扰。因此,滤波器应该是一个带通滤波器。A/D变换是将语音模拟信号转换为数字信号。A/D变换中要对信号进行量化,量化后的信号值与原信号值之间的差值为量化误差,又称为量化噪声。预加重处理的目的是提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱,便于频谱分析。
  2.3  语音信号的特征参数提取
  1、短时平均能量En和短时平均幅度
  短时平均能量和的短时平均幅度主要用途如下:
  (1)     可以作为区分清音和浊音的特征参数。
  (2)     在信噪比较高的情况下,短时能量还可以作为区分有声和无声的依据。
  (3)     可以作为辅助的特征参数用于语音识别中。
  2、短时平均过零率
  短时平均过零率的应用:可以作为区分清音和浊音的特征参数。清音过零率高,浊音过零率低。用两级判决法进行语音端点检测。
  短时平均过零率的局限性:浊音和清音重叠区域只根据短时平均过零率不可能明确地判别清、浊音。
  3、短时自相关分析
  4、短时平均幅度差函数
  5、基音周期估值
  语音的浊音信号具有准周期性,其自相关函数在基音周期的整数倍处取最大值。计算两相邻最大峰值间的距离,就可以估计出基音周期。为了突出反映基音周期的信息,同时压缩其他无关信息,减小运算量,自相关计算之前需要对语音信号进行适当预处理。
  6、线性预测系数
  在语音识别中,常用线性预测编码技术抽取语音特征。线性预测编码的基本思想是:语音信号采样点之间存在相关性,可用过去的若干采样点的线性组合预测当前和将来的采样点值。线性预测系数是以通过使预测信号和实际信号之间的均方误差最小来唯一确定。语音线性预测系数作为语音信号的一种特征参数,已经广泛应用于语音处理各个领域。
  2.4  语音识别的主要方法
  语音识别所采用的方法一般有模板匹配法、随机模型法和概率语法分析法三种。这三种方法都是建立在最大似然决策贝叶斯(Bayes)判决的基础上的。
  (1)模板(template)匹配法
  在训练阶段,用户将词汇表中的每一个词依次说一遍,并且将其特征向量作为模板存入模板库。在识别阶段,将输入语音的特征向量序列,依次与模板库中的每个模板进行相似度比较,将相似度最高者作为识别结果输出。
  (2)   随机模型法
  随机模型法是目前语音识别研究的主流。其突出的代表是隐马尔可夫模型。语音信号在足够短的时间段上的信号特征近似于稳定,而总的过程可看成是依次相对稳定的某一特性过渡到另一特性。隐马尔可夫模型则用概率统计的方法来描述这样一种时变的过程。
  (3)   概率語法分析法
  这种方法是用于大长度范围的连续语音识别。语音学家通过研究不同的语音语谱图及其变化发现,虽然不同的人说同一些语音时,相应的语谱及其变化有种种差异,但是总有一些共同的特点足以使他们区别于其他语音,也即语音学家提出的“区别性特征”。
  除了上面的三种语音识别方法外,还有许多其他的语音识别方法。例如,基于人工神经网络的语音识别方法,是目前的一个研究热点。目前用于语音识别研究的神经网络有BP神经网络、Kohcmen特征映射神经网络等,特别是深度学习用于语音识别取得了长足的进步。
  3结束语
  本文简要介绍了语音识别的主要方法以及语音识别领域的发展与现状,将语音识别的各个过程进行了详细介绍和概括总结,分析了各种语音识别方法的特点和实现方式。语音识别是一门交叉学科,它涉及到信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等方面的知识,所以它的发展依赖于各个领域的技术创新进步。相信在不久的将来,语音识别技术一定会在语音交互、语音检索、命令控制、自动客户服务、机器自动翻译等领域得到广阔的应用。
  参考文献:
  [1]   赵力.语音信号处理[M].北京:机械工业出版社,2011.
  [2]   George Dahl、俞栋等.基于预训练的上下文相关深层神经网络的大词汇语音识别.2012
其他文献
摘要:在当前我国科学技术水平不断提高的背景下,我国变电站规模不断扩大,并且呈现出数字化的发展趋势。在变电站运行过程中,倒闸操作身为变电运行中的重要操作,电力企业要对此项工作引起重视,严格控制倒闸操作中的各个环节,确保倒闸操作各个环节的完整性与失效性,对此项操作中可能存在的危险点要严格控制,最终提高数字化变电站的管理质量以及效率。本文主要内容探究了变电运行倒闸操作的危险点以及控制措施,希望能为我国变
期刊
摘要:园林绿化不但可以使生活环境更加美丽,提高居民的生活品质,还可以拓展城市旅游行业,优化城市投资环境,进而推动城市经济发展,所以相关部门必须重视园林绿化管理。  关键词:园林工程;施工;植物养护;技术  引言  为了提升园林施工质量,实现园林工程经济效益、生态效益的双赢,对如何实现园林施工、养护管理有效结合进行了研究。详情如下。  1城市园林绿化管理的弊端  首先是树木保养人员工作能力不足。任何
期刊
摘要:高压架空输电线路的主要作用是传输电能,对于线路施工质量要求较高。在高压架空输电线路施工中,容易受到周边环境因素的影响,需对高压架空输电线路张力放线施工技术要点进行深入研究。  关键词:高压架空输电线路;张力放线;施工技术  引言  随着国民经济的增长,城镇化水平不断提高,城市商用、民用建筑越来越多,导致电能的消耗量与日俱增。随之而来的是超特高压线路使用比例骤增,因为所有高压输电线路的应用过程
期刊
摘要:化工工艺是通过化学反应将原材料转化为产品的一种工艺。伴随化工工艺自动化水平的不断提升,化工产品的生产工作效率得到极大地提升,但是在化工工艺运用过程中有较为严重的能源消耗以及能源浪费,使得化工企业的生产成本大大地增加。本文首先阐述化工企业节能降耗管理的重要意义,其次深入分析化工企业生产节能降耗管理中存在的问题,最后介绍了化工工艺中常见的节能降耗技术。  关键词:化工工艺;节能降耗技术;存在问题
期刊
摘要:在桥梁工程建设当中,对原材料进行试验检测能够在一定程度避免工程质量出现问题。基于此,本文主要对桥梁工程原材料试验检测关键技术做论述。  关键词:原材料;试验检测技术;桥梁工程  引言  公路桥梁是公路的重要组成部分,而公路运输是我国的主要交通运输方式之一,这就说明公路桥梁养护工作的重要性,而公路桥梁养护的目的在于在桥梁养护过程中发现问题,解决问题,消除隐患,让公路桥梁处于最佳运营状态,保证桥
期刊
目前,随着冷链运输业的发展,冷藏保温车产量越来越多,2018年达到了40000多台,其生产制作需要大板热压机设备,同时,方舱的生产也需要大板热压机设备,大板热压机设备社会保有量约1000台,这种设备体积大,价值高,是生产过程中的关键设备,由于原材料性能和人工操作的影响,长时间使用易出现精度超差、温度场不均匀的问题,这样造成制造产品质量问题,严重影响生产和销售,如何检修是目前生产企业面临的一个共性问
期刊
摘要:在对特殊地形进行测绘过程中应该结合地形实际情况,科学的运用更加高效的测绘技术,以确保测绘结果的准确性。结合有效的工作经验,以特殊地形为主,探索了具体的测绘方法。在实践分析过程中为了不断提高特殊地形测绘技术水平,要采取更加高效的测绘方法,从而保证测绘工作质量。  关键词:测绘工程;特殊地形;测绘技术  引言  当前我国常用的获取地理地形信息的手段是以3S现代技术为依托的,即GPS、RS、GIS
期刊
摘要:现如今,玉米被广泛运用到各个领域,给人们带来了更高的经济效益。在玉米种植过程中,需要不断进行实践与研究,才能有效提高玉米种植水平。我国农业经济的飞速发展不断带动农业结构的调整与优化,粮食产量、种植户收入等均保持稳定上涨的良好态势。而随着不断深入的农业结构调整,我国玉米地区的种植面积也在不断扩大。因此,加强玉米种植管理技术水平,提升大田玉米种植栽培技术是推动我国可持续性发展的重要力量之一。  
期刊
摘要:公路施工過程中最为关键的两个部位就是路面和路基,这两个部位的施工质量直接影响着工程整体水平,整体寿命。所以公路项目中,需要投入最高关注度的两个部分就是路面与路基,只有做好了这两部分质量的控制,运用可行、合理的方法保障施工质量,才能够确保公路项目的实用功能性能与施工质量满足具体要求。公路施工过程中,要投入100%的精力用在关键部位的管理与施工,用合适、可行的技术保障这些部位的作业质量、作业效果
期刊
摘要:城市发展对于国民经济发展的影响非常大,在城市现代化发展进程中,市政工程建设数量与规模持续扩大。给排水工程属于市政建设的重要内容,注重给排水系统的规划设计,能够保障城市内部水系运行的通畅性。此次研究主要是基于生态城市背景,探讨分析市政给排水规划设计,希望可以全面提升城市现代化建设发展水平。  关键词:生态城市;市政工程;给排水系统;规划设计  在社会快速发展下,相应提升人们的生活质量,对于城市
期刊