论文部分内容阅读
随着现代科学和技术的发展,语音识别技术在人机交互中的地位越来越重要。目前非特定人孤立词语音识别系统被广泛应用于手机、PDA等各种智能终端产品中。同时随着嵌入式技术的不断发展,各种终端产品功能越来越强大,人们对语音识别系统的实用性也提出了更高的要求,因此为了提高语音识别系统的实用性,针对非特定人孤立词语音识别系统关键技术的研究已经成为很多科研人员关注的热点。
本文在非特定人孤立词语音识别原理研究的基础上,主要对语音识别系统中的端点检测算法和隐马尔科夫模型算法进行了深入研究。首先在研究语音端点检测算法的基础上,针对传统端点检测算法对噪音自适应性差的问题,提出了一种能够根据环境噪音实时调整门限值的自适应端点检测算法,并对算法实现过程中的各种具体问题给出了详细地解决方案;其次深入研究了隐马尔科夫模型的原理,对传统隐马尔科夫模型中存在一些问题进行了改进,实现了基于状态持续时间分布的隐马尔科夫模型;最后采用最大交互信息模型训练算法和传统的Baum-Welch算法相结合的策略提高了系统的鉴别能力。
针对非特定人语音识别系统的研究,本文提出了一套完整的PC平台的模型训练方案和基于FPGA嵌入式平台识别系统的设计方案。通过分析识别系统中每个模块的算法复杂度,对系统资源进行了合理的软硬件划分。在系统移植时,对识别算法中遇到的浮点运算、指数运算和对数运算等操作设计了相应了移植方案。最后对移植后的语音识别系统,设计了数字测试方案和音频测试方案,用于对基于FPGA的语音识别系统的正确性验证和性能测试。
本文对非特定人孤立词的嵌入式语音识别系统中若干关键技术问题提出了相应的解决方案,通过试验证明了系统的正确性和可用性,对嵌入式语音识别的研究具有一定的理论价值和应用价值。