基于HMM模型改进算法的语音识别系统

被引量 : 0次 | 上传用户:wkp418907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
使用生物特征来进行身份辨识的技术是现在学术界的研究热点,而人工智能技术的重要分支之一则是语音识别。语音识别利用了人类语音中的特征参数以及语言的相关性,从而达到了和语音模板库匹配,实现了语音的辨识。相比于图像及其他人工智能技术,语音识别具有快速进行识别、快速人机交互、可扩展性好、硬件依赖度低、学习能力强、实现成本低等优势,因而各类的安防行业以及所有需要身份认证的情形都可以应用到语音识别。而随着未来人工智能技术的发展,语音识别可作为优秀的人机交互接口这一特点也使得其具有无限发展的前景。本文为了提取人体生物特征,首先分析了语音的发声及听觉模型,然后在得到了语音特征参数后利用改进后的隐马尔可夫模型(HMM)训练算法来训练语音数据并建立语音模板,最后识别时再利用了HMM的识别算法来进行模板匹配。本文首先研究了语音的发声机理及语音成分的分析,去除了无声段后得到有效语音段。然后根据研究美尔倒谱模型(Mel),得到了符合人耳听觉模型的能表示语音特征的一组参数。并且,本文还通过对比常用于语音识别的LPC模型参数,体现了美尔倒谱模型在应用于语音识别上的优势。在为语音特征参数建立模板库及识别的过程中应用了隐马尔科夫模型,本文分析了隐马尔科夫模型的原理及缺陷,提出了改进的隐马尔科夫模型,即引用了遗传算法的随机性使得语音特征参数建立模板库的过程更加具有鲁棒性和准确性。本文以HTK语音识别工具为基础,它提供了最基础的隐马尔科夫模型的实现,然后并入了遗传算法工具包GALib,优化了Baum-Weich算法进行语音训练的过程。虽然遗传算法的随机特点会一定地减缓训练过程收敛速度,不过却由于排除了传统隐马尔科夫模型训练算法易于导致局部收敛的弱点,更容易找到全局最优参数,从而使得训练的数据准确性提高,提高了最后使用Viterbi算法的识别正确率。
其他文献
中国古典美学的“空”范畴最初产生于道家,同时又受到了佛家和儒家的影响,是儒释道三家合力的结果。在其发展过程中,先后与“无”、“静”、“清”、“淡”等范畴相互交融,产生了
随着科学技术进步以及国家经济建设的发展,为修建大跨度的钢管混凝土拱桥提供了良好的支撑条件,随着钢管混凝土提篮拱桥跨度进一步增大,也就增加了施工过程中的索力优化及线形控
近年来,纳米技术的快速发展给生物成像领域带来了很大的发展。纳米材料由于其特殊的表面效应、体积效应以及量子尺寸效应,使得纳米材料的光学、力学、磁学等特性产生了巨大的变
我国诗歌史上的最高巅峰就是唐诗,唐代有大量各种题材的优秀诗作涌现,如边塞诗、山水诗、田园诗、咏物诗、爱情诗、送别诗等都不乏闪光之作,人们对这些作品也给与了高度关注,做了
所有权与经营权相分离是现代公司最基本和最主要的特征,而所有者与经营者追求的目标不同,因此产生了委托代理问题。高管持股制度通过赋予经营者部分剩余索取权,实现委托代理双方
为了减少武器装备的故障以及维修时间,提高武器装备的可用度和重要部件的使用寿命,采用基于状态的维修技术与方法已成为当前维修领域研究与应用的热点。从武器装备的维修需求
虚拟现实是一种多通道的新型人机交互接口,它提供了具有沉浸感的智能虚拟环境并允许用户和该环境进行交互。计算机技术、交互技术和人工智能等相关技术的快速发展促进了虚拟
“军控外交”特指在军控领域(包括军控、裁军和防扩散)为维护国家主权和安全利益,从事的谈判、缔结条约、出席国际会议、参与国际组织等外交活动。军控外交是现代外交中的重要组
目的运用核素肾动态显像评价上尿路梗阻致肾积水的患肾功能损害程度及梗阻解除术后患肾功能可恢复程度,为临床上上尿路梗阻性肾病患者的治疗(手术)及预后提供一个客观的理论依据
随着农村经济结构的调整, 乡村学生对于多元的经济、 文化需求日益增加, 陈旧单一的教育方法以及教育手段已经不再适用于乡村学校教育.因此我们教师要针对未成年人的身心特点