论文部分内容阅读
使用生物特征来进行身份辨识的技术是现在学术界的研究热点,而人工智能技术的重要分支之一则是语音识别。语音识别利用了人类语音中的特征参数以及语言的相关性,从而达到了和语音模板库匹配,实现了语音的辨识。相比于图像及其他人工智能技术,语音识别具有快速进行识别、快速人机交互、可扩展性好、硬件依赖度低、学习能力强、实现成本低等优势,因而各类的安防行业以及所有需要身份认证的情形都可以应用到语音识别。而随着未来人工智能技术的发展,语音识别可作为优秀的人机交互接口这一特点也使得其具有无限发展的前景。本文为了提取人体生物特征,首先分析了语音的发声及听觉模型,然后在得到了语音特征参数后利用改进后的隐马尔可夫模型(HMM)训练算法来训练语音数据并建立语音模板,最后识别时再利用了HMM的识别算法来进行模板匹配。本文首先研究了语音的发声机理及语音成分的分析,去除了无声段后得到有效语音段。然后根据研究美尔倒谱模型(Mel),得到了符合人耳听觉模型的能表示语音特征的一组参数。并且,本文还通过对比常用于语音识别的LPC模型参数,体现了美尔倒谱模型在应用于语音识别上的优势。在为语音特征参数建立模板库及识别的过程中应用了隐马尔科夫模型,本文分析了隐马尔科夫模型的原理及缺陷,提出了改进的隐马尔科夫模型,即引用了遗传算法的随机性使得语音特征参数建立模板库的过程更加具有鲁棒性和准确性。本文以HTK语音识别工具为基础,它提供了最基础的隐马尔科夫模型的实现,然后并入了遗传算法工具包GALib,优化了Baum-Weich算法进行语音训练的过程。虽然遗传算法的随机特点会一定地减缓训练过程收敛速度,不过却由于排除了传统隐马尔科夫模型训练算法易于导致局部收敛的弱点,更容易找到全局最优参数,从而使得训练的数据准确性提高,提高了最后使用Viterbi算法的识别正确率。