噪音环境下汉语连续数字识别与研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:h462r5134dg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言是人类最重要的交流工具,它能准确、高效、方便的传递信息。随着社会的不断发展,越来越多的机器参与到人类的活动中来,因此人类和机器的关系就变得越来越密切和重要,语音交互处理也成了人机交互的重要手段之一。在语音交互以及识别过程中不可避免的存在环境噪声的影响,目前语音识别系统对安静环境下的语音识别已达到比较理想的识别率,但在有环境噪声情况下识别率还不理想,因此加强抗噪能力是语音识别过程中需要进一步研究和解决的问题。论文首先介绍国内外语音识别技术的发展现状,分析语音识别在应用中存在的难点及语音识别中的连续数字识别还需改进的方面。目前语音识别采用时域和频域的基本处理方法。论文首先在时域处理部分对已有的端点检测技术进行改进,重新设置阈值提高语音检测效果。其次,研究语音识别中隐马尔可夫模型(Hidden Markov Models,HMM),并围绕HMM讨论评估、解码、训练三个基本问题及解决方法,给出HMM自身所存在的缺点和最优解的局限性。然后,研究现阶段语音增强中小波变换、维纳滤波、谱减法等算法,比较这几种算法优缺点。最后,结合matlab仿真软件和VS2005软件给出连续数字语音识别在改进后的谱减法,提取特征参数,HMM训练和识别上完善实验方案。实验结果表明改进后的谱减法提高了语音识别率。
其他文献
推荐系统是互联网高速发展的产物,在人们的生活、工作及学习中发挥着非常重要的作用。现如今,推荐系统已经在电商、电影、社交等领域获得飞速发展,国内外针对推荐系统的应用
在当前所有生物识别技术中,自动指纹识别技术是其中使用最为普遍的技术之一。它大致包括三个阶段,即指纹图像预处理(指纹图像分割、增强、细化)、特征提取、特征匹配,而通常
随着互联网+时代的来到,网络与人们的学习、生活以及工作等都发生了越来越紧密的联系,与此同时也使得图像数量急剧增加。那么,如何从海量的图像数据库中极速、精确地检索图像
当建筑单层高度超过4米时,感温探测器失去效应;超过12米时,烟雾探测器部分失去效应,而图像型火灾探测器在高度超过20米时也可以正常工作[1]。图像型火灾探测器响应速度快,不受高度
跳频通信具有良好的抗干扰、抗衰落和多址通信以及频谱利用率高等优点。无论民用和军事方面应用都非常广泛,本身具有的特点极大提高了抗干扰和被截获的能力,在通信系统中占有重
全球卫星定位导航系统因其定位精度高、连续性好等优点而被广泛应用于抗震救灾、国防军事、现代农业、智慧城市等各大领域,但单一的卫星导航系统易受恶劣地貌环境或人为干扰
提取作入射到传感器阵列上的信号源的位置,即为达波方向(DOA)的估计。DOA估计适用无线通信、雷达、射电天文学、声纳、导航、多目标追踪及其他工程应用。电磁矢量传感器阵列相较
随着社会信息化程度的加深,对通信系统容量、质量和不同场景适应能力的需求越来越高。本文借鉴甚小线性调频键控(Very Minimum Chirp Keying,VMCK)的技术思路,利用调频信号的
北斗(Compass)卫星导航系统是一种重大的空间信息基础设施,在社会、经济、军事和科研等领域被广泛应用。卫星导航信号是联系空间段、地面段和用户段的核心纽带,具有十分独特
超短波通信的通信质量高、通信距离远、信道条件好。因此超短波电台广泛的应用于军事通信、地址灾害监控、洪水预警等很多系统。在无线通信系统中,射频收发机位于系统的最前端