基于DTW模型的非特定人孤立词语音识别研究

来源 :河北工业大学 | 被引量 : 4次 | 上传用户:sunj2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,语音识别技术不断发展,系统识别率和识别性能不断提高,得到了越来越广泛的应用,其中孤立词语音识别技术,以其对计算量存储量的低要求和高灵活性,在诸如自动控制和智能家居等领域,如仪器设备、机器人、车辆驾驶和家电的操控等方面有着良好的应用前景。本文重点对非特定人孤立词语音识别的预处理、特征参数提取、模式识别三个阶段展开研究,主要完成了以下的工作:(1)在对语音识别的相关原理进行了分析的基础之上,以英语语音识别为例,在端点检测的研究过程中,发现目前的检测算法存在不足,对一些多音节词的判断并不是很精确,为以后的识别带来了困难,为此,提出了向前多次搜索的过渡区检测算法,加入过渡区,设置最大过渡区语音帧数,并通过实验验证了过渡区检测算法的有效性。(2)在特征提取的研究中,比较了线性预测倒谱系数(Linear Predictive Cepstral Coefficients,LPCC)和美尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)的性能,选择MFCC系数作为本文的特征参数。(3)识别模型方面,探讨了动态时间规整(Dynamic Time Warping,DTW)、矢量量化(Vector Quantization,VQ)、隐马尔可夫模型(Hidden Markov Model,HMM)以及人工神经网络模型(Artificial Neural Network,ANN),相关的对比研究表明基于DTW的语音识别算法更适合应用于非特定人的孤立词识别。目前的DTW算法识别时要求待识别语音和模板端点对齐,需要对待识别语音进行非线性变换,增大了语音信号的失真度,影响了最终的识别率,为解决这个问题,本文提出了一种解除端点对齐限制的DTW算法,优化了搜索路径的约束条件,通过合理划分搜索范围,避免了因非线性变换引起的信号改变,并对改进前后的算法进行了分析。(4)设计了非特定人孤立词语音识别系统的软件部分,进行了相关的仿真实验验证工作,给出了改进前后系统的识别率和识别效率等实验结果,并进行了比较和分析。另外在不同信噪比下,应用改进之后的端点检测算法和传统的端点检测算法对待测语音进行识别实验,验证了改进的端点检测算法具有更好的抗噪性。
其他文献
日前,中国医学装备协会发布了《数字化X射线摄影系统(DR)市场分析报告》。《报告》称,2007年~2011年,我国DR设备保有量由1780台增加到8968台,年销量由720台增加到3294台,年均复合增
报纸
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
近年来,受新媒体冲击,传统媒体报纸的发行量每况愈下,报纸印刷企业普遍面临报纸减版减量、营业收入不断下滑的状况。为保持较好的营业利润和现金流动,成本控制就显得尤为关键
文章依根据机场飞行区跑道横坡要求及盾构掘进引起地基沉降断面的曲线形态,基于飞行区道面结构与地基沉降发生协调变形的前提假设,推导了盾构施工穿越飞行区跑道时不引起道面结
(1)原因分析:①润滑油添加不足或油路渗漏严重,油底壳内油面过低,引起机油泵泵油不足;②润滑油过稀,如错用润滑油牌号.润滑油质量差,油底壳漏进柴油或水;③油底壳网式滤清器堵塞,维护保
期刊
工商管理是与社会经济发展联系十分紧密的应用性学科,医药院校工商管理专业重点培养具有医药特色的应用型工商管理人才。针对目前医药院校应用型工商管理人才培养出现的培养
静电放电无处不在,水上航行的船舶也不例外。以油轮为主,简单论述了船舶静电安全现状和其中存在的一些问题,以及船舶静电放电与危害及其特点,以降低船舶静电安全事故发生的可能性
提出了磷酸铵镁(MAP)法循环处理氨氮废水的新方法。在对MAP的热分解进行特性分析的基础上,利用MAP在100℃左右温度下直接进行热解2 h的产物来处理高浓度氨氮废水。研究表明,对
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技