【摘 要】
:
语音识别将语音数据转换成文本序列,是人机语音交互的主要组成部分。语音识别技术从最初的孤立数字识别发展到现阶段的非特定人、大词汇量连续语音识别。维吾尔语属于阿尔泰
论文部分内容阅读
语音识别将语音数据转换成文本序列,是人机语音交互的主要组成部分。语音识别技术从最初的孤立数字识别发展到现阶段的非特定人、大词汇量连续语音识别。维吾尔语属于阿尔泰语系突厥语族,是黏着性语言,同一词干利用丰富的词缀可产生超大词汇。维吾尔语发音时由若干音素拼接而成,在元音和谐、辅音结合等方面有自己独特的规律。本文结合维吾尔语自身特点,建立了包括64个发音人的维吾尔语连续语音语料库;研究了维吾尔语连续语音识别基元的选取。基于以上研究,本文选取三音子作为基本的识别单元,利用国际上流行的语音识别工具——隐马尔科夫模型工具(HTK)建立了维吾尔语的三音子声学模型,并使用决策树、三音子绑定、修补哑音、增加高斯混合分量等方法提高模型的识别精度。在词层上,本文使用了适合于维吾尔语语音特征的语言模型——基于统计的二元文法语言模型。最后,在DOS环境下,本文采用上下文相关的三音子声学模型结合基于统计的二元文法语言模型对测试集进行了大量的识别实验,句子的识别率达到了68.98%,词的识别率达到了94.65%。用VC2005对HTK工具进行二次开发,创建了维吾尔语连续语音识别系统,并进行了实时的语音识别实验,男生和女生句子的识别率分别达到了63.31%和65.67%,,词的识别率分别达到了90.25%和91.40%。
其他文献
“诗趣”是陶濡在文人绘画中的诗情、诗意、诗性的艺术趣味,中国传统文人画早期就有“诗”的渗透和表达。“诗趣”是中国文人画的主要特点。作为一种独特而有深度的图像形式,
世界上多数发达国家很早就建立了城市搜索与救援队,它们是一个国家经济发展到一定水平的标志。建立救援队可以减少灾害损失,提高城市应对灾害的能力,保证城市可持续发展。不
我国是最大的甘薯生产国,占世界甘薯产量的83%左右。在薯类加工的过程中产生了大量薯渣,这些薯渣水分含量高,容易腐败变质,污染环境。干薯渣中含有约22%的膳食纤维,可以作为
近年来,随着新一轮课程改革的实施和素质教育的进行,学校教育的目的不再仅仅是传授学生知识,更重要的是培养学生健康的心理、正确的世界观、人生观、良好的道德品质和崇高的
本文以空间平台对空间目标采用光测图像方法进行观测为背景,研究了基于直线特征重建空间非合作目标三维结构和测量空间合作目标分离后与空间平台相对位姿的有关算法。空间环
偏心支撑钢框架体系是最近发展起来适用于高烈度地震区建筑的一种新型抗侧力结构体系,它将抗弯钢框架良好的变形、耗能能力和中心支撑钢框架结构的强度、刚度好的优点有机地
高层钢结构设计中框架结构体系分为抗弯钢框架、中心支撑钢框架和偏心支撑钢框架。抗弯钢框架具有良好的耗能能力,但其抗侧刚度较小,若通过加大梁柱截面的方法提高框架刚度则
融资租赁方式一直是我国航空公司引进飞机的主要方式之一,随着我国民航事业的快速发展,飞机融资租赁在我国也将有更大的发展空间。因此,研究飞机融资租赁的法律问题具有重要
目的观察植入式心脏复律除颤器(ICD)对恶性室性心律失常的治疗效果,同时与单纯药物治疗效果相对比,对ICD治疗恶性室性心律失常的疗效及安全性做一评估。方法符合2002年ACC/AH