简单语音识别系统的设计实现

来源 :中国新通信 | 被引量 : 0次 | 上传用户:pipiyouxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】针对现有简单语音识别系统的识别率较低、识别速度较慢的问题,在对语音识别原理研究的基础上,对DTW语音识别算法进行了改进,使得简单语音识别系统能够准确、快速的进行识别。
  【关键词】语音识别信号处理DTW
  一、引言
  根据语音识别系统所使用的环境和平台不同,语音识别技术朝着两个方向发展:一个方向是大词汇量的连续语音识别,该方向所处理的语音较为复杂;另一个方向就是向着中小词汇量的孤立词汇语音识别,该方向所处理的语音相对较为简单,应用范围也有一定的限制,如玩具、语音导航等。虽然简单语音识别系统对于能识别的词汇量没有太高的要求,但是目前的一些简单语音识别系统的识别速度慢、识别率较低,导致用户体验较差。
  二、语音识别系统原理
  语音识别在本质上属于模式识别的范畴,其系统结构与模式识别具有相似之处:根据相关的识别算法对语音信号进行特征参数的提取,然后先进行学习后再对语音信号进行识别。在学习阶段,通过给出的训练数据建立起参考模板库;在识别阶段,将待识别语音信号的特征参数与参考模板库中的参数进行对比,得到与待识别语音信号最接近的模板,输出该模板作为语音识别的结果。
  三、简单语音识别系统的改进与实现
  DTW在简单语音识别中已经可以达到较高的识别率,因此本文选择DTW作为语音识别的模式匹配算法,并对端点检测进行一定的改进来实现语音识别系统的设计。
  3.1端点检测的改进
  在进行端点检测前,为短时平均能量和短时过零率设定两个门限值。在静音段,当短时平均能量或短时过零率大于低门限值,则开始准备标记语音起点,由此进入过渡段。但是在过渡段中并不能确定是否真正进入语音段,当短时平均能量和短时过零率都小于低门限值时认为是噪音,并不记录语音起点,恢复为静音段;当短时平均能量或短时过零率大于高门限值,则认为是真正的语音片段,将状态进入语音段。进入语音段后还要记录语音段持续时间,若该段时间较短则认为是噪声,继续检测后面的语音,如果满足一定的时间长度则标记语音起点并将其记录为一段语音。
  3.2DTW的改进
  DTW的核心思想是进行动态规划,从而解决了语音识别中的发音长度不一致的匹配问题。在进行DTW时,通过动态匹配找到一个最佳路径,把语音信号的特征参数通过这条最佳路径映射到参考模板库中,这条最佳路径要求语音信号和参考模板之间的累积距离最小。
  经典的DTW算法规定待识别语音信号和模板中信号的首尾必须完全一致,但是端点检测确定的首尾与实际存在一定的误差,造成识别率有所下降。为此,可以对DTW的端点的限制适当放宽。即允许起点在(0,0)、(0,m)或者(n,0)上,终点在(N,M)、(N,J)或者(I,M)上。端点要求放宽后对端点检测精度的要求就降低了,提高了识别的速度和精度。
  虽然语音的速度不同,但是语序是确定不变的,因此路径中每一点的斜率必然大于0。而为了防止过度搜素浪费资源,可以对搜索路径的斜率加以限制,由于语音信号的扩压是有限的,因此可以舍去那些向X轴或者Y轴过度倾斜的路径。具体做法是:将搜索路径中每个点的最大斜率设为2,最小斜率设为0.5,这样就可以大大降低搜索范围,减少了计算量,提高了识别速度。
  另外,还可以在进行相似度匹配时设定一个合理的阈值,如果计算出的某一部分的相似度与该阈值相差太远,则立即认为待识别语音与当前模板不匹配,转而进入与下一个模板的相似度计算,这样就可以减少大量的计算量,从而提高简单语音识别的速度。
  3.3实验及数据
  在实验室较安静的环境下对男女声识别进行了测试。发音内容为0~9的数字,采样率为24KHz,帧长20ms,帧移10ms,识别正确率达到了95%以上,原DTW算法的孤立字识别时间是6~7s,而采用本文改进算法的识别时间减少到2~5s。因此,本文方法可以实现快速准确的简单语音识别。
  四、结束语
  采用本文方法可以有效提高端点检测的精度、语音识别的正确率和识别速度,该方法完全满足简单语音识别系统的应用。
  参考文献
  [1]张振锋.基于小词汇量孤立词语音识别系统的研究与设计[D].长安大学,2007.
  [2]刘建辉,卢珞先,黄涛.一种小词汇量快速语音识别系统的实现[J].武汉理工大学学报,2006(28).
  [3]龚伟.小词汇量孤立词语音识别系统的DSP实现[J].低压电器,2009(20).
其他文献
【摘要】 情景教学指在教学过程中为了达到既定的教学目标,引入、制造或创设与教学内容相适应的具体场景或氛围,引起学生的情感体验,从而激发学生学习的积极性、主动性。高中信息技术课中便利的多媒体设备,有利于形、光、声、色等巧妙结合与运用,从而实现有效教学。本文试图根据情景教学实例的成功与失败展开研究,分析如何在高中信息技术课上开展情景教学。  【关键词】 信息技术 情景教学 实例 感染性  建构主义认为
期刊
【摘要】本文提出一种灵活的、可动态装载、基于组件模块化的对称式主/主型高可用性热备份技术的系统软件框架,大大地扩展了高可用性计算能力,使得在ATCA高级电信计算平台上的所有组件能够协同、高效地保证系统服务的高可用性。  【关键词】ATCA高可用性对称式主/主型动态选举机制分布式  一、概述  基于ATCA的高级电信计算架构的系统,虽然在硬件设计上就考虑了系统的高可用性要求,但是要达到电信级99.9
期刊
【摘要】通信工程建设是一项综合性工程,涉及到多门学科。本文从我国通信建设工程中存在的问题入手,如成本控制、财务核算和网络安全等,并提出相应的策略。  【关键词】通信工程建设存在问题对策  如今,信息技术的高速发展之下,网络通信已经成为了最重要的通信手段之一。同时,人们对于通信的安全性也更加重视,从通信网络的物理安全、数据安全、运转安全以及内容安全等多个方面入手,不断打造安全的内外网通信安全。本文从
期刊
【摘要】本文主要根据探测系统的实际需求,阐述数据库的设计目标与设计原则。提出综合探测系统数据库的具体设计内容与优化方案。  【关键词】综合气象探测系统数据库设计优化  伴随着现代化气象水平的不断提高,以及现代气象体系的完善与发展,气象管理活动和气象业务中收集和积累了许多的气象信息和资料。其管理方式和载体形式多种多样,所以建立一套标准化和完善化的综合气象探测系统数据库十分有必要。  一、设计目标与设
期刊
【摘要】上海交通车管业务经过这几年的努力,已逐步打造出一个较为完整的信息化平台,该信息化平台包括了多类型的网络和多类型的业务系统;因此对于上海交通车管信息安全防范工作除了各个网络的安全,还包括各个网络的系统的信息交互的安全。本文就该信息化平台采用的几项网络安全防范措施作简要的介绍以供探讨。  【关键词】信息化网络安全管理  上海市公安局交通警察总队作为这样的一个承担着服务、管理、监管等一系列职能的
期刊
【摘要】随着计算机和网络应用的普及,电脑信息安全所面临的危害也在成倍增长,并逐步渗透到社会经济、商业秘密、国家安全乃至个人隐私等各个领域。网络通信安全对于每一个计算机用户来说都是一个不可回避的问题。了解掌握网络通信的安全策略对我们来说,也显得尤为重要。  【关键词】网络技术网络通信安全安全策略  一、网络技术  1.1网络技术的发展历程  “网络技术”又名“数据通信”或“计算机通信”,主要研究的是
期刊
【摘要】本工作研究了普通压电打火机中的压电点火器发电特性,以调查其产生的电能能否满足小型电子设备对电能的需求。研究发现压电打火器能够产生高达千伏的高压脉冲,于是通过接入整流桥、电容和稳压器来对高压脉冲进行整流和稳压。研究还发现,接入负载的阻值对压电点火器的输出功率有急剧影响,当阻值为0.22 kΩ时输出功率达到极大值0.26 mW,基本可以满足一些小型电子设备的电能需求。  【关键词】压电点火器人
期刊
【摘要】在无线传感器网络中,由于传感节点自身携带的能量有限,以及部署规模大和所处应用环境的复杂性,致使节点一旦部署就难以补充能量或更换电池。因此,诸多节能传输策略的研究一直是该网络面临的重要挑战之一。本文结合无线网络能耗模型和邻居节点数量,提出了一种自适应的三维地理路由机制。  【关键词】无线传感网络地理路由  无线传感器网络(Wireless Sensor Networks,WSNs)是由部署在
期刊
SOFT3000作为承载邢台全区固话交换的软交换设备,下带的单纯用户数就达30万之多,中继量达6万线,如此高负荷的软交换设备,时有出现某个FCCU模块CPU过载的提示信息,一旦出现CPU过载信息,就有可能会危及系统安全,本文从工作实际出发,探索寻找CPU过载原因的切入点,意在提高维护人员的维护水平,为本地网话务安全保驾护航。  一、SOFT3000 CPU过载问题描述  邢台本地网SOFT3000
期刊
我网络维护中心承担着全区网络设备的维护,如何在保证网络安全畅通的同时,进行技术革新创造、有效地降低网络维护成本,合理调整网络配置,提高网络运行效益是我网络维护中心员工普遍关心并努力追求的目标,尤其在网络结构不断发生变化的过程中,与时俱进,拓宽思路,转变固有思维模式,根据话务结构合理调整资源更是一个长期和综合性的任务。  一、原12117报时台业务状况  12117报时台的前身是117报时台,是自有
期刊