基于隐马尔可夫模型的语音识别技术研究

被引量 : 0次 | 上传用户:wish_hjl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术是机器学习的重要内容之一,涉及信息处理、人工智能和模式识别等多个学科内容,已经在社会生活中得到广泛的应用。语音识别是让机器听懂人的语言,理解人的意图,并对其做出相应的反应,实现人与机器的交互通信。本文基于隐马尔可夫模型(Hidden Markov Model),建立了一套语音识别仿真系统。本文首先分析语音信号的预处理过程,提出采用双门限法,即将短时能量和短时过零率相结合,对语音信号进行端点检测。相对于单一方法的端点检测方法能得到更精确的语音段,为语音信号的后续处理奠定了基础。接着详细阐述了两种特征参数提取方法,包括线性预测倒谱系数(LPCC)和Mel倒谱系数(MFCC),并分析了MFCC的一阶差分系数,得出结合一阶差分后的倒谱参数,可将语音识别率提高4%左右。最后,本文着重研究了基于HMM的语音识别算法,在Matlab平台上实现了一个较为完整的语音识别仿真过程,包含语音库的建立、预处理、特征参数提取、训练(即参数选择)、识别等过程。本论文建立了一个由10个人的录音组成的语音数据库,由汉语数字0-9、“郑”、“州”、“大”、“学”共14个样本组成,总共700个发音,为论文提供仿真实验数据。对HMM在实际中的应用做了优化处理,包括初始模型选取、Viterbi算法的对数处理以及参数重估问题。通过分析实验结果,得出CHMM状态数为4,训练次数为20次,特征参数选取48维LPCC和MFCC的混合参数,可使语音识别系统对于汉语孤立词的识别率达到90%。在试验过程中本文还分析了由于汉语发音的复杂性和特殊性而引起的有些样本元素的误识问题,并提出了待解决方案。
其他文献
<正>某种程度上说,签证体系的进化史,也是其外交功能强化史。签证外交是不对称的较量,美欧为代表的西方国家占据着绝对优势。在赢得印度大选当天就得到美国承诺将给予其赴美
<正>今年以来,火爆的楼市逐渐展现颓势,成交持续低迷,价格徘徊不前。在并不"灿烂"的市场之下,房地产利润一降再降,为增加利润,有些企业甚至以牺牲自身信用为代价。面对鱼龙混
近年以来,各国灾害事件频繁发生,这些灾害发生后,事发点及周围的路网往往受到严重的损坏,导致灾区群众的疏散效率极低,对人们的生命财产构成了严重的威胁。为了减轻或者避免
航路规划技术是反舰导弹实现各种战术应用和提高打击效果的主要途径之一,也是一个复杂的多约束、多目标优化问题,其本质是综合利用信息处理、决策、优化等技术,在满足各种约束条
目的探讨高血压患者焦虑、抑郁状况及其相关危险因素,为高血压的预防提供科学依据。方法采用病例对照的流行病学方法,选取高血压住院患者143例作为病例组,同时选取性别年龄等
幼师语文教学中使用多媒体现代化教学手段,可以激发学生学习兴趣,加深对作品内容和作者情感的理解体会,拓展知识空间,提高学生的语文素养和语文应用能力。
本文介绍了进口2m~3柴油铲运机使用的容积式手动液压操纵机构的工作原理,分析了工程机械上使用操纵机构的基本要求,并提出了使用该操纵装置的体会。 This paper introduces
研究背景与目的对于呼吸功能严重受损的患者,机械通气是必不可少的治疗手段。然而机械通气是把双刃剑,在提供有效呼吸支持的同时,还能导致肺部严重损伤,即机械通气所致肺损伤
民国时期是一个承前启后的历史发展时期,各种社会因素都在向着近代化的方向发展。其中的婚姻状况就出现了近千年以来的第一次重大的变化,离婚率急剧上升。其原因主要与旧家族
目的:1、应用组织瓣环位移(Tissue motion annular displacement, TMAD)技术测量三尖瓣环位移(Tricuspid annular displacement, TAD)评价房间隔缺损(Atrial septal defect, A