论文部分内容阅读
随着社会的发展,计算机日益成为人类生活必不可少的一个部分.如何才能方便的与计算机进行交流就成为人们需要解决的一个重要的问题.语言是人类最方便的交流方式.因此人们希望能够采用语言与计算机直接进行交流,也就是实现人机之间的真正的语声通讯.作为这一要求的计算机自然语言输出部分,各种语言的语音合成系统近几年来得到了十分迅速的发展,涌现出了大量的新技术和新设计.在语音合成系统中,韵律模型是必不可少的.它将前面的文本分析和后面的语音生成联系起来,实际上起着一个重要的桥梁作用.好的韵律模型,使之能够更加贴近自然语言中的各种各样的韵律现象,是高自然度语音合成系统中的一个重要的组成部分.该文以此为目的,对建立韵律模型中的基音周期的提取、基频模式的获取方面进行了深入的研究.该文首先介绍了汉语语音中的一些基本知识,重点放在基音周期估计算法的研究和基频模式的获取.研究了频域上的基频周期估值算法,如:自相关算法、LPC残差算法、倒谱法等;时域上的基于波形外观的基音估值算法.并总结以上算法的优缺点提出了取初值步进式寻找极值点的基音周期估值算法.为了更准确的提取基音周期,设计实现了音节标注工具Speech Assistant,并使用该工具进行基音周期数据的采集工作.研究了聚类算法,克服传统的k均值算法的缺点选择改进的自组织数据分析方法(ISODATA)进行基频模式的提取.对聚类的基频序列数据进行了基频序列规整、滑动平均、零均值化等预处理.在此基础上进行聚类得到了相应的基频模式,并对其结果进行了分析.最后该文对整个论文进行了总结,并提出了进一步工作内容.