基于人工神经网络的语音识别研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:shinny321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言是人类之间交流信息的主要手段之一,自电脑发明以来,人们就一直致力于使电脑能够理解自然语言。语音识别技术是集声学、语音学、语言学、计算机、信息处理和人工智能等诸领域的一项综合技术,应用需求十分广阔,长期以来一直是人们研究的热点。神经网络是在现代科学研究成果的基础上提出来的模拟人脑结构机制的一门新兴科学,它不是人脑真实的全面描述,而是这类生物神经网络的抽象、模拟和简化,其目的在于探索人脑的信息加工、存储和搜索机制,从而为人工智能和信息处理等学科的研究开辟新途径。人工神经网络就是采用物理可实现的系统来模拟人脑神经细胞的结构和功能的系统,它模拟了人类神经元活动的原理,具有自学习、联想、对比、推理和概括能力,为很好地解决语音识别这样一个复杂的模式分类问题提供了新的途径。本文对语音信号的预处理、特征提取、以及神经网络模型的建立,都进行了较深入的研究。所作的主要工作如下:1.对国内外语音识别和神经网络技术发展状况作了较全面的总结分析,对语音识别 技术的分类、语音识别系统的构成、语音信号的预处理、语音信号特征提取(文 中主要研究了线性预测倒谱参数LPCC 的提取和美尔频率倒谱系数MFCC 的提 取)等关键环节的技术问题进行了深入的理论分析。2.针对非特定人的英语元音识别问题,建立了一个概率神经网络模型。将对英语元 音的识别转化为分类问题,采用概率神经网络模型作为分类器,并在Matlab 环境 下进行了相关的仿真实验。实验结果表明,概率神经网络在进行元音识别的时候 具有不错的识别率。3.对国内外模糊神经网络的发展状况作了比较全面的总结分析,深入研究了多层前 向神经网络及BP 算法,以及它们与模糊逻辑理论的结合,在此基础上,对传统 的Sugeno 模型作出修正,并建立了一个模糊神经网络模型。4.针对非特定人英语元音识别的问题,推导了一种多输入多输出的既能学习数值数 据,又能学习模糊规则的模糊神经网络。针对BP 算法学习速度慢的特点,文中 采用增加动量项和变学习因子,大大加快学习速度。
其他文献
随着英语学习需求的多样和大学生整体英语基础的提高,外语学习中交际能力被广泛重视.语言交际能力不仅包含正确的表意,也涉及融入特定实践社群,正确合适的运用语言.本文基于
为加强对青岛市学校校本课程开发的研究,本文在对校本课程概念、目标、开发领域等基本理论进行分析基础上,结合青岛市中小学校本课程开发实际,对校本课程开发工作进行了探究.
期刊
一个地委书记为了补充家用和抚养收养的孩子,竟然到医院血库去三次献血;生活极其节俭,经常吃的是白饭就榨菜,工作一忙,开水泡馒头是常有的事;穿的几件内衣打着补丁,连块香皂
2003年,曲靖市政府确立了在云南省率先基本实现工业化和建成现代工业强市的战略定位,其核心内容和实质,就是坚持根据曲靖工业发展的实际情况,增强用高新技术和先进适用技术改造传
谁是元凶?rn湖北少女感染的包虫病,病症学名为骨棘球蚴病,包虫学名为细粒棘球绦虫.这种绦虫并不是人类新发现的寄生虫,早在1786年便被西方医生所发现,但是,由于宠物与人类越
本文选取工程保证担保制度在政府公共投资项目中的应用为研究主题,力求通过对政府公共投资项目工程保证担保制度的较为系统的研究,为提高我国政府公共投资项目效益和管理水平提
随着新课程教学理念的提出,在中职德育教学中将心理健康教育融入其中,在德育教学中不仅要注重进行德育知识教学,还要注重将心理健康教育融入其中,在学习相关知识内容的同时,
电化教育在成人教育的应用当中具有多个方面的优势,不仅能够有效提高教学质量,教学效率,更是能够得到丰富教学方法的目的.而成人教育当中受到多个因素的影响,学生往往在课堂
3G手机,这个可以有rn我们先来看看标准,国际通行以SAR作为衡量手机辐射的基本限值,即单位时间内单位质量的物质吸收的电磁辐射能量.目前国际通用标准有两个,一个是欧洲标准2 W
期刊