汉语语文转换中NHMM算法和音库词库设计的研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户：AKDelphi

【摘要】

：

在语音识别领域,汉语语文转换是一个热点话题,隐马尔可夫模型(HMM)是语文转换中常用的方法。它能很好地描述语音信号的平稳性和可变性,近年来倍受国内外学者的高度重视,但其

【作者】

：

张林林

【出处】

：

西南交通大学

【发表日期】

：

2011年期

【关键词】

：

语文转换参数优化加权概率汉语音库汉语词库

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在语音识别领域,汉语语文转换是一个热点话题,隐马尔可夫模型(HMM)是语文转换中常用的方法。它能很好地描述语音信号的平稳性和可变性,近年来倍受国内外学者的高度重视,但其识别性能却不能令人满意。在语文转换的音库词库设计模式方面,也存在多种不同设计模式。而不同的模式会有不同的占比空间率和转换效率,如何找到一种高效的音库词库设计模式则变得尤为重要。本论文将对这两方面的改进提出一种的新的算法和设计模式,以提高语文转换的转换效率语文转换在采样量化过程中的算法研究一直是一个研究难点,且对于语音环境的要求也非常复杂,本论文拟改变以往的传统HMM研究方法,引入了一种改进型的识别算法NHMM,进一步提高了语文转换中的转换效率。传统的HMM算法,虽然被广泛应用,但是它自身也存在着一定缺陷,比如说由于它只是一个概率和统计理论算法,并且是离散型概率统计算法,所以它不能很好的描述语音信号的时间相依性,且对于量化时的误差分析也没有着重考虑,这样会在一定程度上降低语文转换的识别率。因此,本文提出了一种能够引入加权函数的算法——NHMM算法。NHMM算法是本论文在HMM算法的基础上提出的一种改进型算法,就是为了进一步减少语音信号在量化的过程中出现的较大误差。为了提高语音信号的识别率,在NHMM算法中,加入了一个新变量——量化误差E,作为加权值,加入到HMM算法的参数序列中,让其作为HMM算法的一个参数参与运算,这样将量化误差作为考虑因素的改进型HMM算法在识别率上,相比传统的HMM算法有了很大的提高。在设计音库词库方面,在查阅大量的关于汉语语文转换的相关文献的过程中,发现很多研究都是将重点放在语文转换中的音库设计上,都是在力求音库文件的最大覆盖性,但详尽化的音库文件设计必然导致库体容量的快速增大,这对终端的硬件配置提出了非常大的挑战,如果占用大量系统资源,必然导致其可行性下降。本论文的研究切入点是尽量精简语文转换的音库文件,这必然导致在语文转换时,对人的口语录入的准确性进行了忽略考虑。从粗糙采样的设计理念出发,模糊化采样精度,进一步提高了语文转换中词库匹配的效率。通过三种库体的设计结构的优劣比较,最终确定一种最高效的库体设计模式。在最终的方法中,词库结构采用三段格式,分别是单字表、双字表和词库。通过这种设计模式,在不降低语文转换精确度的前提下对语音实行粗糙性录入,降低音库容量的同时,详实化词库结构。本论文提出的基于精简语文转换的词库设计理念具有较强的新颖性和实用性。

其他文献

绘画作品中的三教合一思想——以魏晋南北朝为例

儒家思想是中国文化的主流,但随着佛教的广泛传播和势力日盛及道教逐步走向上层,三者在矛盾冲突中都意识到吸收彼此精华以完善和提升自己的重要性,三者在冲突中融合,在融合中

期刊

魏晋南北朝三教合一绘画作品

沈阳地铁广告的发展对策研究

近年来,沈阳地铁开通与运营的步伐越来越迅速,这给沈阳地铁广告的发展带来了新的机遇。本文通过对沈阳地铁广告视觉传播方式进行梳理,分析目前沈阳地铁广告存在的问题,并为沈

期刊

沈阳地铁广告视觉传播形态发展对策

锂辉石浮选中高效浮选剂的联合使用

从锂辉石浮选剂作用机理入手,开展锂辉石与石英、长石等矿物分离试验,并取得重大突破。当给矿品位1.14%,长石、石英含量>70%时,在pH 8.0~8.5的矿浆中,以氢氧化钠、氯化钙为活

期刊

螯合剂混合捕收剂锂辉石浮选

螯合捕收剂B130浮选难选氧化铜矿石的研究

螯合捕收剂B130浮选难选氧化铜矿石具有捕收力强、选择性好、使用方便等优点,尤其是对含铁高、泥化严重的矿石更是如此。它能与中性油组成一种新的捕收剂体系,能与黄药混用产

期刊

浮选难选氧化铜矿石螯合捕收剂B130协同效应中性油

大型泵站主电机调速方式的选择

分析了定子变频调速方式在泵站的应用情况及其优缺点；介绍了在风力发电中获得大量应用的交流励磁电机在泵站中应用的可行性；研究了已在自来水厂等获得成功应用的内反馈调速方式

期刊

泵站变频调速交流励磁电机内反馈调速pumping station variable frequency speed control AC excitat

基于流固耦合的防滑差速器内部流场数值分析与优化

为研究某款防滑差速器内部流场分布规律,在流固耦合理论指导下,采用软件仿真的方式对该款差速器内部流场规律进行了研究。首先根据防滑差速器内部结构建立其三维流体域的简化

期刊

防滑差速器流固耦合数值分析优化anti slip differentialfluid-structure interactionnumerical an

民族音乐与多元化音乐教育的探索

随着各种经济和科技的发展,信息的传播也越来越迅速,多元化以此也越来越接近生活。当经济发展到一定程度后,人们开始注重艺术文化的发展,民族音乐已经不能满足人们的精神需要

期刊

民族音乐多元化音乐教育

新形势下团青思想政治工作的探析

以身作则是做好共青团工作的有效途径,对团员的思想政治工作具有示范和激励作用,青年团成员正在形成人生观、价值观和世界观,因此,有必要加强他们的思想政治教育,营造良好的

期刊

新形势团青工作思想政治

激励器频控接口在哈里斯“N+1”系统中的应用

在“N＋1”系统中，能否准确实现共用备机的频率切换是很关键的。本文将会阐述哈里斯全固态调频发射机Z10CD构建的“N＋1”系统中，如何通过FREQ接口实现激励器输出频率的变换。

期刊

N+1哈里斯激励器FREQ频率变换

易拉罐:一拉即开的包装设计传奇

早在原始社会人类就学会了使用罐子。随着科技的发展，人们不断地改进罐装器皿，其中易拉罐的发明，为罐装饮料的工业化开辟了一条便捷之路。

期刊

包装设计易拉罐罐装饮料

汉语语文转换中NHMM算法和音库词库设计的研究

与本文相关的学术论文