面向语音合成的印尼语文本分析与处理

来源 :云南大学 | 被引量 : 0次 | 上传用户:ccjhvv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向。语音合成在导航、通信等领域都有广泛运用。目前,文语转换依旧是语音合成的主要方法,即运用计算机实现从给定文本到相应语音的转换。目前,对语音合成的研究较集中于英语、汉语等语言中,对于印尼语的研究相对较少。印尼语属马来-波利尼西亚语系西印度尼西亚语支,是一种由拉丁字母构成的、有明显词边界的语言。本文主要针对印尼语语音合成系统,研究并实现印尼语前端文本分析中的语音语料库构建、文本归一化、音节化以及音子的划分。本文的主要工作包括:(1)印尼语发音语料库的构建。从印尼语网站中收集了印尼语文本,对文本进行去重和去非法字符处理,并将其用作构建印尼语发音语料库的初始文本语料库。在该语料库的基础上,综合考虑句子长度和高频词挑选得到印尼语的发音语料库,并用客观的评价标准对其进行评价。(2)印尼语文本中非标准“词”的归一化。研究了常出现在印尼语文本中的非标准“词”及其歧义种类,并提出印尼语文本非标准“词”的归一化方法和实现流程。用正则表达式与关键词相结合的方法对文本中的数字串、与数字连用的特殊字符的进行归一化处理,用字符匹配的方法对文本中的缩写词进行归一化处理。对实验结果统计得到文本归一化正确率达96.2%。(3)面向语音合成的印尼语的音节化。研究了印尼语的音节构成,在此基础上提出适用于语音合成的印尼语音节化方案,并对其进行实现。采用基于音节列表的逆向最大匹配的方法,并在此基础上添加零声母规则实现音节划分。经统计得该次实验集内测试的正确率为98.2%,集外测试的正确率为97.1%。(4)印尼语音子的划分。针对印尼语语音合成,提出并实现了基于印尼语特性的音子划分方案。采用基于声韵母结构的方法和音素的结构的方法分别确定了音子列表,并运用字典匹配的方法实现印尼语语音语料库文本的音子划分,得到韵律文本。
其他文献
模切件是指将原材料按照预先给定的形状进行裁切和精密加工而形成的零配件。随着电子消费品行业的飞速发展,对模切件的海量需求使得在生产过程中对模切件的质量控制显得尤为
本文针对永磁同步电机(PMSM)采用传统矢量控制方法存在转矩脉动较大,超调量大等缺点。首先采用将模糊控制和传统比例积分调节器(PI)结合起来的方式;同时针对数字信号处理器(D
近年来,区块链技术得到了快速的发展,涉及加密货币,金融,物联网,医疗等各个领域,各种类型的区块链应用中产生了海量的交易数据,这为研究人员通过分析区块链数据,了解和解决相
近年来,随着大数据和深度学习技术的不断发展,对话系统在各个领域越来越引起人们的重视。对话系统大致可分为两种:任务导向型对话系统和非任务导向型对话系统。面向任务的系
随着大数据新兴技术的发展,出现了越来越多的持续监控应用场景,例如大型基础设施网络监控和疾病实时监控等。在这些场景中,数据流上聚类、分类和模式挖掘等问题都是研究者关
行政协议的诉讼案件不断增加,其中涉及行政协议解释纠纷的案件不占少数。目前,我国法律规范尚未明确行政协议解释的司法审查规则。在现有的司法裁判中,行政协议解释司法审查主要存在两种路径:公法模式的审查思路与私法模式的审查思路。但是,我国司法实践关于公私法模式审查路径选择缺乏统一的标准,导致部分法院随意选择审查路径,造成同案不同审的现象,最终的司法认定结果也存在偏差。公法模式与私法模式审查思路的主要区别在于:适用公法模式审查思路的,法院认可有关行政机关的优先解释权,法院在有关行政
学位
本文以液化天然气(LNG)翻滚问题为工程背景,研究多组分液体翻滚发生临界条件、翻滚发生时间和持续时间预测模型。翻滚是LNG储存运输过程中较容易发生的—种事故——在LNG储罐
在过去的几年中,图像分类算法,特别是深度神经网络(Deep Neural Networks,DNN)在诸多领域被广泛应用,并且取得了极大的成就。但最近的研究表明,通过对输入图像加以肉眼无法识
基础论(foundationalism)和融贯论(coherentism)是当代两种最主流的认知确证(theory of epistemic justification)理论。它们之间的争论构成当代知识论的主线之一。基础论主张区分基础信念(basic belief)和衍生信念(derived belief),基础信念的确证不依赖于其他任何信念,但衍生信念必须得到一个或多个基本信念的支持。因此,基础
印度佛教大师陈那开创佛家逻辑——因明学或量论的先河以后,在法称和律天,以及释迦慧和天主慧等因明大师的继承和弘扬下得到了极大的发展和传播,成为印度佛教的“五明”之一