汉语普通话韵律结构的自动分析

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:starfox_vip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
九十年代以后,波形拼接技术成为语音合成中的主流,但如何能合成出高自然度和高清晰度的语音一直是语音合成中的核心问题。目前通用的文语转换系统(TTS)采用基音同步叠加(PSOLA)技术,它在拼接语音片段之前,要根据上、下文的要求,用PSOLA算法对拼接的单元的韵律特征(基频、音长和音强等)进行调整,这些系统比早期的LPC合成系统和共振峰合成系统在可懂度和自然度上有很大的提高。但是,由于用PSOLA算法对拼接的单元在声学上做了处理,这必定会影响合成语音的质量,特别是同真实发音人的语音相比较。所以这种方法虽能对韵律能进行方便地调整,但于此同时却带来了音质的下降。随着计算机业的飞速发展,计算机的内存容量、硬盘容量和运算速度都有了巨大的提高,现在各大公司的文语转换系统都采用了数据驱动的波形拼接技术,特别是基于服务器端的合成系统。数据驱动的TTS系统,在系统前端对文本和韵律分析加韵律标记时,并不是基于规则的,而是先对标注好韵律标记的语料库用统计、机器学习或人工神经网络等方法自动建立韵律模型,在系统实时运行时通过韵律模型对未加韵律标记的文本自动加韵律标记;在系统后端,由于有一个很大的语音库,所以用于拼接的单元不是唯一的(例如:某个带调的音节在语音库中有若干个)。有这样一个设想:用于拼接的侯选单元足够多,能够遍及所有协同发音和连读变调的可能性,那么用于拼接的单元就不需要韵律调整,只需在所有侯选的拼接单元中选一个与其左右音节及在韵律结构中最相近的就能满足语音的韵律要求。由于拼接单元没有经过声学处理,合成的语音音质就不会下降,可同发音人的语音相媲美。数据驱动的TTS系统就是基于上述的设想来设计和建立的,它与通用的TTS的区别之处:1)少了信号处理的模块。2)韵律结构的确定对合成语音的质量起了决定性的作用。本文主要是为解决在数据驱动的TTS系统前端对文本自动加韵律标记的问题,由于韵律结构的确定对合成语音的质量起了决定性的作用,所以对韵律结构的分析提出了很高的要求,传统基于规则的方法在面对自然语流中大量的特征就显得束手无策了,本文采用对韵律结构建模的方法来弥补基于规则方法的不足。首先,设计了一套韵律标注体系,在为TTS系统而建立的语音库上进行韵律标注。本文关于汉语韵律结构的思想主要来自于潘悟云教授“短语音系理论在汉语语音计算机合成中的运用”课题的结题报告,他的两个学生盛金标和马敏华的硕士毕业论文《汉语普通话停顿的声学特征和韵律结构》和《汉语普通话轻声》也给了我很大的帮助。其次,对人工加韵律结构标注的文本进行分析,比较了它与语法结构在各个层次上的关联性和差异性,得出韵律结构不总是和语法结构相匹配,两者的差异从最底层的单元――词开始的;并试图去研究韵律单元的长度与句子长度的相关性,得出韵律短语与句子长度呈正相关性;还分析了韵律结构的声学表现,得出停顿在声学上除了表现为静音段外,还表现为停顿前一个音节时长的延长,汉语五种声调中第二声音节时长最长,轻声音节的时长最短,是音节平均时长的76.7﹪。这些分析都是基于“真实”的语料用统计的方法进行的,为后面建立韵律模型提供了许多有益的先验知识。再次,对韵律结构建模,本文尝试了多种方法,包括基于统计的规则、隐马可夫模型(HMM)和分类及规约树(CART)。其中分类及规约树的方法得到较好的结果,但还达不到我们的要求和目标。我们提出了基于CART的自底向上有层次的处理方法,并对此又进行改进。在多种方法的性能比较中,修正的基于CART的自底向上有层次的处理方法在四项评价标准中都达到了最优。最后,用听辨实验来评价韵律结构模型的性能。有二组语音,一组是用加了自动分析出来的韵律结构标记的文本合成出来的声音,另一组是用人工加了韵律结构标记的文本合成出来的声音。对这两组语音进行性能优劣的听辩实验,结果表明两者的性能比是:57比43。
其他文献
期刊
自动化控制技术在我国许多行业领域中已经得到了应用,并且取得了较好的成效,自动化控制作为一项先进的具有绝对优势的技术,如今在化工行业中也得到了广泛应用,这是因为自动化
介绍了MPEG-2的PSI服务信息和DVB中的SI服务信息,给出了利用SI服务信息创建EPG的应用模型,同时阐述了SI服务信息在DVB中如何与MPEG-2中的PSI信息的衔接应用。 The PSI service
MPEG-4与MPEG-1和MPEG-2视频处理方式的最大区别是在MPEG-4中引入了视频对象VO(VideoObject)的概念。对MPEG-4基于内容的视频编码方式进行了描述,并重点分析了MPEG-4视频编码算
随着我国电力系统规模的不断扩大,对系统的安全、稳定、可靠运行提出了更高的要求,自动化控制技术以其自身诸多的优点在电力系统中获得了应用.文章主要针对于电力系统自动化
该文主要运用符号美学的语用原理,在现实-语言-人的三维结构和文化大语境、语言发展状况和个人语言能力的互动机制场景中,解析中国现代象征主义诗歌的语言形态、“意-象-言”
现代背景和文化冲突是考察近百年来中国历史的两个重要前提.十九世纪末中国社会开始进入从传统向现代的转型时期.在这一典型的外源现代化进程中,西方近现代文明的外部冲击和
该文以南宋迄清中叶具有典型意义的十五种选本为研究对象,探讨了欧阳修文选编刊的发展历史.全文共分三章.第一章《宋元时期欧阳修文选的实用色彩》,对南宁陈亮、元代虞集、朱
李渔是明末清初的一位多才多艺的文学家,李渔毕生戏剧实践的经验与理论思考的成果主要集中在《闲情偶寄一书的"曲话中,即《李笠翁曲话》.在这部分著述里,李渔充分表达了他对