非特定人孤立词语音识别技术研究

来源 :中南林业科技大学 | 被引量 : 0次 | 上传用户:xiaotiantiandetian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术对人类的生活方式产生了深远的影响,因此一直以来都是世界各地学者们深入研究的热点。目前语音识别广泛采用动态时间规整(DTW)技术和基于概率统计原理的隐马尔可夫模型(HMM)技术,将人工神经网络(ANN)应用于语音识别是近年来提出的一种较新的研究方法。语音是一个复杂的非线性过程,因此基于非线性理论,具有自适应性、并行性、鲁棒性容错性和学习性等特点的人工神经网络技术逐渐成为时下语音识别新的研究方向。本文以神经网络中使用率最高的BP网络为模型,初步探索了其在语音识别领域中的应用。本文的研究内容和成果如下:首先,从语音识别线性产生模型和系统模型上分析了语音信号的基本原理。研究了语音预处理的整个流程,包括对原始语音信号的采集、预加重、分帧加窗和端点检测,并探讨了不同语音特征值的获取方法,重点分析了美尔频率倒谱系数(MFCC)的提取流程,并提出了一种基于离散小波变换的语音特征参数——DWTC参数。其次,介绍了语音识别中常用的DTW、HMM算法,重点研究了人工神经网络算法。给出了神经网络算法的推导过程,分析了该算法存在的缺陷和不足,并在前人研究的基础上做出了对神经元传输函数进行调整的改进。具体方法是通过向tan-sigmoid激活函数引入温度系数和位置系数从而使网络参数信息更加丰富,加快收敛速度,给出了改进算法的推导过程。在改进的BP算法中引入了动量因子,并且采用批处理的训练方式,通过一个简单的函数逼近实验验证了改进算法的有效性。最后,通过matlab实现了一个基于BP神经网的语音识别仿真系统,使用自录的语音完成对系统的训练和识别。在系统中采用了一种时间规整算法,用来对提取的特征参数进行压缩合并,以满足后端BP神经网络对输入数据维数相同的要求。通过实验可以得出如下结论:改进过后的学习算法在识别率和收敛速度上均要优于传统的BP训练算法;BP网络隐含层神经元的个数对系统识别率有较大的影响,需要通过实验来确定最佳取值;并且验证了基于小波变换DWTC参数比MFCC参数能更好的表征语音信号。
其他文献
工作流管理系统完成工作流的定义和管理,并按照在计算机中预先定义好的工作流逻辑推进工作流实例的执行。工作流过程建模是给业务过程计算机化的表示。模型描述能力的强弱决定
工作流技术源于计算机支持协同工作领域,是实现过程集成的有效途径之一。工作流技术为业务流程自动化和构建流程应用提供手段,使得在企业应用系统开发和集成过程中,实现了流程逻
目前工作流研究往往局限在单个组织内部,随着电子商务、电子政务和互联网的发展,跨组织工作流管理系统越来越成为工作流研究的主要领域之一。如何使多个自治、异构的工作流产品
目前,网络安全问题日益严峻,俨然成为非常重要的一个研究课题。面对大规模的网络安全时间序列数据,高效并准确地实现网络安全的态势预测具有非常有意义的研究价值,通过态势的
双代数是同一基集上的代数共代数对,它结合了代数的构造和共代数的观察。计算机科学中的许多概念都是构造与观察的结合体,如程序、进程、自动机等,都可用双代数方法进行研究。目
随着计算机技术和网络技术的发展,多媒体通信成为了业界关注的焦点。VOIP作为多媒体通信中的一种,以其价格低廉,灵活提供多种增值业务等众多优势,成为下一代网络(NGN)的发展目标
在当今计算机视觉领域中,随着计算机技术带来的技术改革,已经有越来越多的研究者加入到该领域的研究中,在该领域中的目标跟踪和行为理解已经成为了现下热门的研究课题,有很多的研
信息作为一种资源,它的普遍性、共享性、增值性、可处理性和多效用性,使其对于人类具有特别重要的意义。信息安全的实质就是要保护信息系统或信息网络中的信息资源免受各种类型
通过分析目前水力量测系统数字仿真与优化研究中的不足,在吸取前人研究成果的基础上,将面向结构图的仿真方法应用于水力量测系统数字仿真与优化中,建立系统面向结构图的仿真理论
本论文结合我省气象部门的实际需求,基于Lotus Domino/Notes建成了省—市—县的应用系统平台,并采用Domino集成的编程工具设计开发了内部论坛、电子公告、政务管理、业务管理、