论文部分内容阅读
语音转换是一种对说话人语音特征进行转换的技术。它是在保留原语音文本信息和说话人音色不变前提下,转变说话人的方言语音特征,使转换后的语音听起来像另一个地区的方言,或者是普通话语音。其研究对语音分析、语音合成、语音编码、语音识别和语音增强等有重要的促进作用。由于语音转换是语音信号处理领域一个较新的分支,以前对它的研究相当欠缺,考虑到我国的实际情况,为促进不同方言地区人们交流,语音转换是从研究到实用过程中不得不面对的问题,具有很强的研究价值和实际意义。
本文主要研究同语种下不同地区说话人之间的语音转换,由于我国方言众多,不可能研究完所有方言语音。在不失个性与普遍性的前提先,课题选择了作者家乡——邢台地区方言和普通话为研究对象。主要内容如下:
1)从汉语的声学特点和韵律特征出发,诸如汉语的声调及特点、汉语的语调及模式,分析和研究了邢台地区方言和普通话韵律特征(音高、时长、幅度)之间的相互关系。
2)以音节作为拼接的语音基元,在波形叠加技术PSOLA(pitch synchronous overlap add)的基础上,结合FD—PSOLA和TD—PSOLA算法的优势提出基于时频联合的波形叠加算法实现韵律控制。首先利用FD—PSOLA算法对语音信号进行音高的调整,然后返回时域,利用TD—PSOLA算法对信号的时长,能量进行变换,这样既弥补了以往采用TD—PSOLA算法对音高改变幅度较大时产生的混叠现象,又改善了FD—PSOLA算法对时长及能量的修改效果。
3)最后本文对语音转换系统进行了仂真实验。经系统转换后的语音在可懂度和清晰度方面都是令人满意的,在自然度上也得到了一定的改善。本文的工作也为语音转换系统的后续研究奠定了一个较好的基础。