论文部分内容阅读
语言是人类最重要的交流工具,它能准确、高效、方便的传递信息。随着社会的不断发展,越来越多的机器参与到人类的活动中来,因此人类和机器的关系就变得越来越密切和重要,语音交互处理也成了人机交互的重要手段之一。在语音交互以及识别过程中不可避免的存在环境噪声的影响,目前语音识别系统对安静环境下的语音识别已达到比较理想的识别率,但在有环境噪声情况下识别率还不理想,因此加强抗噪能力是语音识别过程中需要进一步研究和解决的问题。论文首先介绍国内外语音识别技术的发展现状,分析语音识别在应用中存在的难点及语音识别中的连续数字识别还需改进的方面。目前语音识别采用时域和频域的基本处理方法。论文首先在时域处理部分对已有的端点检测技术进行改进,重新设置阈值提高语音检测效果。其次,研究语音识别中隐马尔可夫模型(Hidden Markov Models,HMM),并围绕HMM讨论评估、解码、训练三个基本问题及解决方法,给出HMM自身所存在的缺点和最优解的局限性。然后,研究现阶段语音增强中小波变换、维纳滤波、谱减法等算法,比较这几种算法优缺点。最后,结合matlab仿真软件和VS2005软件给出连续数字语音识别在改进后的谱减法,提取特征参数,HMM训练和识别上完善实验方案。实验结果表明改进后的谱减法提高了语音识别率。