非母语说话人发音空间建模方法的研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:lucieming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文研究新疆地区非母语说话人汉语普通话的语音识别技术,新疆非母语说话人汉语普通话语音识别的研究不仅具有理论意义,而且还具有很大的现实意义。文中以新疆维吾尔族说话人为例,研究如何利用少数的非母语说话人汉语普通话的语料数据在标准普通话模型的基础上构建适合非母语说话人汉语普通话识别器的方法。本文主要有以下几个研究点:(1)对于基于主元音和声韵母两种音素建模单元的优劣选择。对于标准普通话声学模型的建立,分别使用声韵母和主元音两种音素单元进行模型的建立,并通过实验对比两种建模方法的优劣性。实验结果表明,在同等条件下,声韵母建模的性能要明显好于主元音,并且当混合高斯数目达到32个时,可以使建模单元性能达到最佳。(2)基于声韵母映射规则的多发音词典的获取方法。当使用标准普通话模型于新疆非母语说话人汉语普通话发音识别时,识别率会急剧下降。针对这个问题,可以使用多发音字典自适应的方法来提高识别率,与训练非母语说话人汉语普通话模型需要采集很多的非母语汉语语料相比,此方法只需要很少一部分非母语说话人的语音数据就可以使误识率相对降低10.44%。(3)对于多发音字典的获取,本文从音素和音节两个级别来进行多发音字典的扩展,并选用了三种剪枝策略来进行发音变异映射的剪枝压缩。通过大量的对比实验分析,选取最适合新疆非母语说话人汉语普通话多发音字典扩展的剪枝策略。实验表明,使用基于声韵母并使用相对最大剪枝策略扩展出来的多发音字典相对其他的方法可以最大程度的提高识别率。同时,当字典规模数是标准字典的1.4-1.7倍时,识别率处于一个相对较优的水平。
其他文献
本文主要研究了两个科学问题,一是对半导体纳米晶的金属异价掺杂问题:采用“由外及里”的离子交换方法,利用膦配体(如三丁基膦等)诱发的阳离子交换合成掺杂有异价离子Cu~+的I
推动构建全覆盖高质量的监督体系天津市纪委书记、监委主任邓修明监督是纪检监察机关基本职责、第一职责,要聚焦系统集成、协同高效,推动构建以党内监督为主导、各类监督贯通
我国侦查讯问录音录像制度的功能定位经历了由偏向固定口供到保障犯罪嫌疑人合法权益、防止刑讯逼供的转换过程,这一过程也对录音录像制度的完整性产生了一定影响。在研究录
Cu及Cu合金材料是一种重要的有色金属材料,由于具有优异的物理和力学性能,它在电子工业等领域获得了广泛的应用。但随着科学技术的快速发展,尤其是微电子工业的快速发展,传统
如果可以将图G的顶点集合划分为两个部分V1和V2使得在G[V1]中最大度至多为d1,在G[V2]中最大度至多为d2,那么称G是(d1,d2)-可染的.我们已经知道对于任意的(d1,d2)∈ {(2,6),(3
论文针对姬黄32区块延9油组油藏开发中存在的主要问题,在层序地层学、沉积学及油藏描述的理论指导下,充分利用地质、测井和测试等资料,在建立层序格架、分析沉积相和认识储层
光镊技术自诞生至今,已经过了近四十年的发展,在多个学科领域得到重要的应用。尤其是在生命科学领域,光镊技术所具有的非接触、无损伤、高精度的特点使其非常适合生物细胞、
环境的破坏和自然资源的枯竭促进了能源的二次革命,具有高能量密度、长寿命、对环境友好无污染的锂离子电池应运而生,但能够决定电池工作电压的正极材料比容量却较低,限制了
高超声速飞行器具有大空域、超高速、长距离的特点,能够实现全球快速精确的战略打击,是确保国家战略安全的重要保障之一。超燃冲压发动机的使用,满足了飞行器超高马赫数飞行
目前,随着人们饮食结构和生活习惯的改变,癌症在全世界范围内都呈现出高发态势。目前尚未找到预防癌症的有效途径,因此对抗癌症只能是早发现早治疗。芪类化合物具有多种生理