论文部分内容阅读
语音识别技术是指将人说话的语音信号转换为可被计算机程序所识别的文字信息,属于多维模式识别和智能计算机接口的范畴。语音识别的研究目标是让计算机“听懂”人类口述的语言。语音合成技术主要解决的问题就是将文本状态的文字信息转化为可听的声音信息。语音识别正逐步成为信息技术中人机接口的关键性技术,语音识别技术与语音合成技术结合使人们把各种传统上需要同用户交互的信息转化为语音命令操作。盲人自身对定位及路况信息获取的需求变得日益迫切,而定位导航系统能很好地满足这一要求。常用的导航系统需要手动输入目的地,引入语音识别技术后改变了该现状。作为人机交互的有效手段,语音识别技术的研究日渐成熟、实用。使用具备语音识别技术的导航系统,盲人用户无需键盘便可以与其交互,使得导航设备的操作更加方便、快捷。本文即设计语音识别技术应用在盲用导航系统中的解决方案,并基于该方案实现一个原型系统。首先,本文深入研究语音识别技术原理和方法,分析语音识别引擎Aitalk 3.0的使用方法和开发流程。针对盲用导航系统的需求,选择嵌入式开发板的硬件平台和定制特定的嵌入式Windows CE操作系统软件平台,给出语音识别技术应用在盲用导航的系统中的解决方案,并基于该方案实现了一个原型系统。本系统是将导航目的地名称以语音方式输入,把得到的识别结果与添加的目的地命令词匹配,再把匹配正确的目的地命令词对应的坐标传递给导航系统。调用语音合成技术把系统中的得到文本信息和导航信息转换成语音信息,以语音播报的方式传递给盲人用户。其后,对实现的原型系统进行测试,验证语音识别技术在盲用导航系统的应用的可行性,能够在一定程度上帮助盲人使用定位导航系统获取路况信息。最后,总结全文并对目前程序存在的问题进行了分析,并指出系统需要完善和改进的地方。