论文部分内容阅读
语言是人类之间交流信息的主要手段之一,自电脑发明以来,人们就一直致力于使电脑能够理解自然语言。语音识别技术是集声学、语音学、语言学、计算机、信息处理和人工智能等诸领域的一项综合技术,应用需求十分广阔,长期以来一直是人们研究的热点。神经网络是在现代科学研究成果的基础上提出来的模拟人脑结构机制的一门新兴科学,它不是人脑真实的全面描述,而是这类生物神经网络的抽象、模拟和简化,其目的在于探索人脑的信息加工、存储和搜索机制,从而为人工智能和信息处理等学科的研究开辟新途径。人工神经网络就是采用物理可实现的系统来模拟人脑神经细胞的结构和功能的系统,它模拟了人类神经元活动的原理,具有自学习、联想、对比、推理和概括能力,为很好地解决语音识别这样一个复杂的模式分类问题提供了新的途径。本文对语音信号的预处理、特征提取、以及神经网络模型的建立,都进行了较深入的研究。所作的主要工作如下:1.对国内外语音识别和神经网络技术发展状况作了较全面的总结分析,对语音识别 技术的分类、语音识别系统的构成、语音信号的预处理、语音信号特征提取(文 中主要研究了线性预测倒谱参数LPCC 的提取和美尔频率倒谱系数MFCC 的提 取)等关键环节的技术问题进行了深入的理论分析。2.针对非特定人的英语元音识别问题,建立了一个概率神经网络模型。将对英语元 音的识别转化为分类问题,采用概率神经网络模型作为分类器,并在Matlab 环境 下进行了相关的仿真实验。实验结果表明,概率神经网络在进行元音识别的时候 具有不错的识别率。3.对国内外模糊神经网络的发展状况作了比较全面的总结分析,深入研究了多层前 向神经网络及BP 算法,以及它们与模糊逻辑理论的结合,在此基础上,对传统 的Sugeno 模型作出修正,并建立了一个模糊神经网络模型。4.针对非特定人英语元音识别的问题,推导了一种多输入多输出的既能学习数值数 据,又能学习模糊规则的模糊神经网络。针对BP 算法学习速度慢的特点,文中 采用增加动量项和变学习因子,大大加快学习速度。