基于神经网络的语音识别系统的实现

被引量 : 18次 | 上传用户:cao678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一直以来语音识别主要以线性理论为基础,其中动态时间规整技术和隐马尔可夫应用最为广泛。然而,人的发音实际上是一个复杂的非线性过程,基于线性理论的识别技术的局限性逐渐显现出来了。语音识别技术若是要取得突破,就必须引入非线性理论的识别技术。随着对生物脑的深入了解,人工神经网络这一非线性理论获得了长足发展,其被广泛应用在语音识别的各个领域,例如车载导航仪、机械的语音控制、语音拨号、语音文档搜索等。但是,神经网络依然存在着不足之处,一是噪声的影响;二是训练速度慢,易陷入局部极小;三是,网络结构的选择没有明确的指导方案。本文就是在此背景下,重点研究了在孤立词的语音识别系统下,如何构建网络和设置参数,以减少机器识别的错误率,提高系统的识别率,实现了一个特定人孤立词的语音识别系统,为以后对噪声下语音识别的研究奠定了基础。本文的研究内容和研究成果为:首先,从语音识别的模型上分析了语音识别的基本原理。研究了预处理中的信号采集、采样、滤波、加窗、分帧、端点检测的方法和原理,并且探讨了语音参数提取的方法,重点分析了LPCC和MFCC系数的提取流程,给出了BP神经网络的学习过程。其次,在matlab7.0软件上实现了语音识别系统的仿真,分别通过选取不同的阶数的MFCC系数和LPCC系数对参数进行提取,用代表点序列时间规整算法对特征参数进行压缩和合并,以满足后端BP神经网络对输入数据维数相同的要求,得出了在孤立词的识别中MFCC系数要优于LPCC系数的结论。最后,采用了不同的网络结构对系统进行训练和测试,得到了不同隐含层神经元个数对网络识别率的影响,并且分别采用2种不同的输出方案进行实验,得到了不同方案下的识别率,得出了在孤立词的识别中采用2进制编码更有利于其在硬件上的实现的结论,并且要通过大量的实验才可得到最佳性能的网络。
其他文献
随着元素形态分析的发展,人们逐渐认识到,元素的有益或有害,不仅与其含量有关,更主要取决于元素存在形态及迁移转化规律。硒是一种人体必需的微量元素之一,硒以无机硒(Se(IV)
结合导生制的特点及职业教育的现状,本文分析了当前高职院校中新生导生制实施的必要性、成果和意义,阐述了具体实施方法,并指出了在导生制实施过程中存在的问题和对策。
随着科学技术的发展、石油产量的相对递减以及环保意识的提高,作为一种洁净能源煤层气越来越引起人们的重视。本区煤系地层具有分布广、层位多、含煤系数高、煤层厚度大的特点
枸杞酒是以枸杞汁为原料酿造的一种果酒,枸杞中含量丰富的类胡萝卜素,它的结构中有较多的共轭双键,使其对氧、光、高温等因素非常敏感,很容易发生氧化、异构化降解反应,而类
随着全球经济一体化发展,各个国家之间的竞争尤其是各大强国之间的考量对比,不再是仅仅参看各国的综合国力水平,而是更为注重该国家的技术创新能力。新观念、新技术和新产品
本文试图从最近50年千差万别的经济增长经历中获得概括性的策略教训。本文围绕两个主要观点展开。一是新古典经济分析比政策从事者普遍带给理论的声誉更加灵活。特别是基本经
近年来,我国经济快速发展,汽车保有量大幅增加,各大城市雾霭天气不断出现,PM2.5居高不下,节能减排已经成为摆在我们面前一项紧迫而艰巨的任务。作为PM2.5“元凶”之一的汽车,
我国作为服装产业生产和需求的大国,却在缝制设备的研发与生产上相比较其他发达国家处于劣势水平,很多先进的缝制设备和重要的零部件需要从国外进口,然后进行消化吸收,这样大
干燥是竹制品生产过程中的重要工序,竹材干燥效果的好坏直接决定着竹质产品质量的优劣。竹材本身色泽淡雅、柔和,富有光泽,具有极好的装饰效果,但在干燥过程中,如果干燥工艺
葡萄果实属于浆果,细腻多汁,酸甜可口,营养丰富,素有“水果皇后”的美誉,深受消费者的喜爱。但葡萄多在盛夏季节成熟采摘,皮薄汁多,易遭受机械伤害和病原菌的侵染,导致腐烂现