采用脉冲耦合神经网络的有噪特定人语音识别系统研究

被引量 : 3次 | 上传用户:nmghdw126com
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机不断向便携化发展及其环境的日趋复杂化,人类迫切希望摆脱键盘的束缚而代之以一种更便捷、自然、有效的输入方式与计算机进行交流。语音识别技术正是在这样的环境中发展起来的。语音识别技术是使计算机根据语音执行相应的命令,为人类服务。目前,语音识别技术已经得到广泛应用。它在家电产品、智能玩具、商业系统的数据库语音查询、工业生产部门的语声控制、电话与电信系统的自动拨号等领域发挥重要的作用,并且极有可能成为下一代操作系统界面。语音识别技术虽然取得了长足的进步,但仍有许多问题有待研究解决,噪声环境下的特定人识别即是其中之一。在实验室环境下的特定人识别系统已经具有较高的识别率,但人们在语音通信过程中不可避免地会受到来自周围各种噪声的干扰,这些干扰导致系统识别率显著降低。基于谱减法计算简单,容易实现的优点,为了提高特定人语音识别系统在噪声环境下的识别率,本文采用谱减法进行语音去噪,同时为了有效抑制谱减法去噪时产生的“音乐噪声”问题,本文在典型谱减法的基础上作了一定的改进。实验结果表明,改进型谱减法能有效的抑制噪声的干扰,且没有产生过多“音乐噪声”,并使系统的识别率得到大幅度提高。特征参数是语音识别系统的基础。特征参数应能完全、准确地表达语音信号所携带的全部信息。对于语音识别系统来说,如何选取能够唯一表征语音的有效且可靠的特征参数,是系统的关键问题之一,直接关系到系统的优劣性和系统的识别率。本文运用脉冲耦合神经网络从语音信号的频谱图中提取熵序列作为系统的特征参数,并将其与常用的线性预测倒谱系数和美尔倒谱系数作对比。实验结果表明,熵序列大大降低了系统数据量,使系统具有较好的实时性和识别率。本文首先介绍研究背景及语音识别的国内外研究现状,简要介绍了语音识别的理论基础及语音学的基础知识。接着对语音识别系统中预处理、特征参数提取、识别模型进行详细介绍。针对在噪声环境下识别率偏低的问题,采用了改进型的谱减法进行语音去噪。文中还介绍了运用脉冲耦合神经网络提取熵序列作为特征参数的方法。最后,根据采用的方法实现了特定人语音识别系统。
其他文献
唐代伟大的医学家孙思邈(581~682年)所著的《千金方》,包括《千金要方》和《千金翼方》,是我国现存最早的医学类书。从唐代至近代将近有一千三百多年了,在这一千多年中,历代
人们对计算机计算能力的需求总是不断增长的,提高计算机计算能力的主要方法有提高单处理器的性能和采用多处理器。提高单处理器的性能主要有两个途径:一是提高主频,二是提高每
基于"中国老年人口健康状况调查"(CLHLS)2011年的数据,对农村空巢老人生活质量进行研究。在生活质量不同的维度上,与农村非空巢老人相比,农村空巢老人的生活自理能力较强,但
试验采用不同的蜡乳液对鸡蛋涂膜保藏,以失重率和新鲜度为指标研究涂膜及温度对其保藏效果的影响;同时研究了贮藏期间蛋清pH值、微生物及感官变化.试验结果表明,同一温度下,
在对桑皮纤维的加工与化学组成进行深入了解的基础上,选用广西绢麻纺织科学研究所开发生产的桑皮纤维和新疆长绒棉为原料,对原料的基本形态与性能进行了测试分析,根据桑皮纤
在人力资源管理中,招聘是人力资源管理的重要模块之一,要成功地为企业招聘到合适的人才,招聘的方法选择至关重要。在招聘的众多方法之中,杜内特(Dunnette)通过对各种人才甄选
<正>2019年1~5月,铜行业运行总体平稳,主要铜产品产量保持增长,精炼铜、铜材产量370万t、685万t,分别同比增长4.4%、11.7%;铜现货均价48 589元/t,同比下降6.5%;铜行业实现利润
目的:建立抗原抗体联合检测酶联免疫方法(ELISA)检测外周血中的HCV核心抗原或抗体,确定适合HCV抗原抗体联合检测方法酶联免疫吸附试验(ELISA)的阳性判断值(Cutoff).并对该检
<正>一想来,七百多年前,在勾栏瓦舍的演出中,当朱帘秀们唱到《谢天香》中关于化妆的一段唱词,必伴着一个个优美的、程序化的然而确实提炼自现实生活的动作,对这些凭空的比比
针对应用多普勒波束锐化技术的空地导弹制导过程,提出一种脱靶量、成像分辨率和经济性综合最优的制导律算法。基于多普勒锐化成像几何建立了方位向分辨率与导弹运动参数之间的