论文部分内容阅读
在语音识别领域,汉语语文转换是一个热点话题,隐马尔可夫模型(HMM)是语文转换中常用的方法。它能很好地描述语音信号的平稳性和可变性,近年来倍受国内外学者的高度重视,但其识别性能却不能令人满意。在语文转换的音库词库设计模式方面,也存在多种不同设计模式。而不同的模式会有不同的占比空间率和转换效率,如何找到一种高效的音库词库设计模式则变得尤为重要。本论文将对这两方面的改进提出一种的新的算法和设计模式,以提高语文转换的转换效率语文转换在采样量化过程中的算法研究一直是一个研究难点,且对于语音环境的要求也非常复杂,本论文拟改变以往的传统HMM研究方法,引入了一种改进型的识别算法NHMM,进一步提高了语文转换中的转换效率。传统的HMM算法,虽然被广泛应用,但是它自身也存在着一定缺陷,比如说由于它只是一个概率和统计理论算法,并且是离散型概率统计算法,所以它不能很好的描述语音信号的时间相依性,且对于量化时的误差分析也没有着重考虑,这样会在一定程度上降低语文转换的识别率。因此,本文提出了一种能够引入加权函数的算法——NHMM算法。NHMM算法是本论文在HMM算法的基础上提出的一种改进型算法,就是为了进一步减少语音信号在量化的过程中出现的较大误差。为了提高语音信号的识别率,在NHMM算法中,加入了一个新变量——量化误差E,作为加权值,加入到HMM算法的参数序列中,让其作为HMM算法的一个参数参与运算,这样将量化误差作为考虑因素的改进型HMM算法在识别率上,相比传统的HMM算法有了很大的提高。在设计音库词库方面,在查阅大量的关于汉语语文转换的相关文献的过程中,发现很多研究都是将重点放在语文转换中的音库设计上,都是在力求音库文件的最大覆盖性,但详尽化的音库文件设计必然导致库体容量的快速增大,这对终端的硬件配置提出了非常大的挑战,如果占用大量系统资源,必然导致其可行性下降。本论文的研究切入点是尽量精简语文转换的音库文件,这必然导致在语文转换时,对人的口语录入的准确性进行了忽略考虑。从粗糙采样的设计理念出发,模糊化采样精度,进一步提高了语文转换中词库匹配的效率。通过三种库体的设计结构的优劣比较,最终确定一种最高效的库体设计模式。在最终的方法中,词库结构采用三段格式,分别是单字表、双字表和词库。通过这种设计模式,在不降低语文转换精确度的前提下对语音实行粗糙性录入,降低音库容量的同时,详实化词库结构。本论文提出的基于精简语文转换的词库设计理念具有较强的新颖性和实用性。