计算机语音转换系统的研究

来源 :河北科技大学 | 被引量 : 0次 | 上传用户:zhuywei0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换是一种对说话人语音特征进行转换的技术。它是在保留原语音文本信息和说话人音色不变前提下,转变说话人的方言语音特征,使转换后的语音听起来像另一个地区的方言,或者是普通话语音。其研究对语音分析、语音合成、语音编码、语音识别和语音增强等有重要的促进作用。由于语音转换是语音信号处理领域一个较新的分支,以前对它的研究相当欠缺,考虑到我国的实际情况,为促进不同方言地区人们交流,语音转换是从研究到实用过程中不得不面对的问题,具有很强的研究价值和实际意义。 本文主要研究同语种下不同地区说话人之间的语音转换,由于我国方言众多,不可能研究完所有方言语音。在不失个性与普遍性的前提先,课题选择了作者家乡——邢台地区方言和普通话为研究对象。主要内容如下: 1)从汉语的声学特点和韵律特征出发,诸如汉语的声调及特点、汉语的语调及模式,分析和研究了邢台地区方言和普通话韵律特征(音高、时长、幅度)之间的相互关系。 2)以音节作为拼接的语音基元,在波形叠加技术PSOLA(pitch synchronous overlap add)的基础上,结合FD—PSOLA和TD—PSOLA算法的优势提出基于时频联合的波形叠加算法实现韵律控制。首先利用FD—PSOLA算法对语音信号进行音高的调整,然后返回时域,利用TD—PSOLA算法对信号的时长,能量进行变换,这样既弥补了以往采用TD—PSOLA算法对音高改变幅度较大时产生的混叠现象,又改善了FD—PSOLA算法对时长及能量的修改效果。 3)最后本文对语音转换系统进行了仂真实验。经系统转换后的语音在可懂度和清晰度方面都是令人满意的,在自然度上也得到了一定的改善。本文的工作也为语音转换系统的后续研究奠定了一个较好的基础。
其他文献
正交频分复用(OFDM)是一种高速多载波的传输技术,具有抗多径衰落的能力和极高的频谱利用率,作为一种新的移动通信技术而受到广泛关注,并且已经被成功应用到多种宽带无线数字
AVS是我国具备自主知识产权的第二代信源编码标准。它的编码效率及竞争性与国际标准MPEG-4/H.264相当,广泛应用于广播、通信、电视、娱乐等各个领域。本文研究了AVS视频压缩
本文详细研究雷达信号处理中存在的对不准损失,并对矢量信号检测方法进行了初步的探索。雷达接收机处理器通常设计成对特定的距离、角度和多普勒检测单元内的信号做出响应。
近年来市场竞争日趋激烈,全球化、信息化、多元化不断加强,能够对市场变化做出快速响应的柔性制造模式成为了制造企业发展的方向,在此背景之下,企业信息管理系统的重要性正变得越
当前机器学习面临的主要问题之一,是在标记训练数据十分有限且不易获得的情况下,如何有效的利用海量的未标记数据。半监督学习是近期出现的一种学习策略,它能够综合应用实际
随着多媒体应用普及的加速,例如像IP语音和视频会议,对无线局域网的高带宽和服务质量(QoS)的需求也在急剧增加。IEEE 802.11分布式协调功能协议(DCF),存在着一定的QoS限制,而
4G以及即将到来的5G,让人们体会到了信息技术迅猛发展给人们带来的方便与快捷。在感受方便快捷的同时,通信系统的安全性也越来越受到人们的关注。为了提高无线通信系统的安全
模式分析作为人工智能和机器学习的重要分支,广泛应用于工业专家系统、生物遗传信息学、宇宙学、天文学和机器人技术。特别是在冯·诺伊曼架构的计算机的计算速度已经不再是
空间超分辨技术是一种阵列信号处理技术,它拥有比传统波束形成方法更高的分辨力。由于其具有较高的估计精度,目前已被广泛应用于雷达、通信、地质勘探和医学成像等众多领域。随
因特网目前已经成为人们交流通信不可缺少的一部分,而便携式设备的发展使人们的移动性越来越强,通信不再局限于固定网络,人们渴望随时随地都能高速接入因特网。无线接入技术