【摘 要】
:
语音合成就是使用专用的硬件设备或计算机再现人能够听得懂的语音信号的过程。语音合成技术是实现人机语音通信,建立一个有听说能力的口语系统所必需的关键技术之一。纵观语
论文部分内容阅读
语音合成就是使用专用的硬件设备或计算机再现人能够听得懂的语音信号的过程。语音合成技术是实现人机语音通信,建立一个有听说能力的口语系统所必需的关键技术之一。纵观语音合成技术的研究已有二百多年的历史,但是真正具有实用意义的近代语音合成技术是随着计算机技术以及数字信号处理技术的发展而逐渐发展起来的。近几十年来语音合成的方法主要有:发音器官参数合成法、源-滤波器模型合成法、单元挑选合成法和可训练语音合成法等等。这几种方法各有优缺点,但是相比较而言,可训练语音合成技术的自动化程度较高,对于不同发音人、不同发音风格、甚至不同语种的依赖性非常小。基于这些特点,本文选用了基于隐马尔可夫模型(HMM)的可训练语音合成方法来进行合成系统的构建。越南位于东南亚中南半岛东部,与中国云南交界,由此带来了两地语言文化及相关人才的频繁交流,以及研究越南语语音新技术的区域优势。所以本文研究了越南语语音合成系统,并希望最终能把研究成果运用到实际中,实现越南语的人机交互。论文的主要工作包括:(1)阐述HMM的基本原理,介绍基于HMM的可训练语音合成系统架构过程。(2)介绍越南语的语音特征、综述越南语语音合成现状,在此基础上进行越南语语音合成系统的数据准备工作。数据准备工作主要包括:语料库构建、音素列表确定、训练数据的标注以及上下文属性和问题集设计。其中最重要的一部分工作就是对训练数据进行标注。本论文中我们采用手工与程序相结合的方式进行语料库标注。(3)在Cygwin平台,根据STRAIGHT合成器的训练流程,用500句已标注的语句完成越南语语音合成系统的模型训练,以及后端合成器的构建。在对待合成语句进行韵律标注后,用合成器生成其语音波形。实验结果表明:利用STRAIGHT合成器进行越南语语音合成是可行的。后续工作重点应为实现越南语文本的自动分析,以及提高合成语音的自然度。
其他文献
多环芳烃(polycyclic aromatic hydrocarbons,PAHs)是一种能在环境中持久性存在的难降解污染物,具有很强的致突变性、致畸性和致癌性。通过微生物降解环境中的 P AHs是目前公认的
目的:检测miR-520e在乳腺组织和细胞中的表达并探讨miR-520e在乳腺癌中所发挥的作用。 方法:采用RT-qPCR方法检测miR-520e在乳腺癌组织中的表达水平;将miR-520e mimic转染到
土壤湿度是影响气候的至关重要的变量之一,它分配着陆地表面的能源和降水,在全球水循环中起着重要的作用。准确评估时空变异的土壤水分对研究地表生物地球物理进程具有重要的意
摘要:新课程改革强调:课堂教学的过程,不仅是知识的传递过程,还应该是一种情感交互的过程。数学教学中,要使人愉快,要让一切教育带有乐趣。为了使使学生喜欢数学、乐学数学,让数学课堂成为学生快乐的生成地,我们应该采用快乐教学法,使学生在愉悦的情绪中获取知识。快乐式教学法不仅能够激发学生学习兴趣,还能活跃课堂气氛、调动学生学习积极性。 关键词:快乐教学;小学数学;兴趣;策略 在小学数学教学中我们不能再
目前,物联网的研究和应用日趋广泛,而物联网应用主导推出的都是满足大众化需求的业务和服务,会从内容引入、平台建设、终端提供等多方面考虑。因此,每推出一项物联网业务不仅
随着计算机技术的迅速发展,信息技术正在改变人们的学习方式,利用网络开展教学已成为当前教育活动的重要发展方向。网络教学可以提供丰富的教育资源,拓宽教育的范围,同时也是提高
随着互联网和多媒体技术的飞速发展,视频数据呈现爆炸性的增长,这对视频数据管理和检索技术提出了更高的要求。运动信息作为视频区别于图像的本质特征,体现了随时间变化过程
长链多不饱和脂肪酸(Long-chain polyunsaturated fatty acid,LC-PUFA)是维持鱼体正常生长发育及生理功能的必需脂肪酸(EFA),主要包括二十碳四烯酸(ARA)、二十碳五烯酸(EPA)和
中国城镇整体进入快速城市化阶段,动态监控并准确预测城镇扩张成为目前学术界研究的热点和政府决策的重点问题。美国军事气象卫星(Defence Meteorological Satellite Program,DMSP)搭载的Operational Linescan System(OLS)传感器获取的全球夜间灯光数据是进行相关大尺度城市化研究的一种有效数据源。利用DMSP/OLS夜间灯光数据提取城镇用地
纤维素酶在降解利用纤维素作为能源物质的过程中起到关键性的作用,对纤维素酶结构功能的深入研究不仅可以丰富酶学研究的理论基础,还具有巨大的应用价值。 已经从福寿螺的胃