语音变调技术研究

来源 :沈阳理工大学 | 被引量 : 0次 | 上传用户:bianhaoyi1000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和多媒体技术的发展,人们的业余生活越来越丰富多彩,对一些音频材料的要求也越来越高,普通的音频材料已经不能满足人们的生产和生活的需求。应运而生的语音变调技术就是在不改变语音可懂度,并保持语速不发生变化的前提下,按照某种算法对给定语音的音调高低进行调整,现实生活中,它的用途随处可见,例如它可以将一个人的声音变得让熟悉它的人听不出来是谁的声音,起到保护个人隐私的目的,另外,它可以将人的声音加以修饰,变成动物的声音,达到为人们提供娱乐效果的目的等等。目前存在的算法多种多样,主要分为时域算法和频域算法,时域算法主要有时域调制法和基于同步叠加固定合成的算法(Synchronized Overlap-Add Fixed Synthesis,SOLA-FS),频域算法主要有频域插值法和基于相位声码器的算法。本文对现有变调算法进行介绍,在介绍各变调方法原理的同时还介绍了各个方法的优缺点,更便于人们针对具体情况选择不同的变调方法。应用比较广泛的当属SOLA-FS算法,SOLA-FS算法分为两个步骤:采样率变换和时长规整。通过对原语音信号采样点进行插值和抽取相结合实现采样率变换,经采样率变换后,原语音长度相应的变长或变短,若想保持语速不变,则需用SOLA-FS算法对语音进行时长规整。该算法简单,但由于对信号采用分段处理的方式,在各段连接点处存在相位不连续的问题,导致变调后语音音质差、有噪声等问题。针对SOLA-FS算法存在的问题,本文在SOLA-FS的基础上,对其进行了改进。新的算法不改变原语音的采样率,而是在播放时采用设定的采样率播放的方法实现语音变调。新的算法通过复制或删除每帧语音的最后一个基音周期来实现采样率变换。而且,通过反推得出每帧语音的长度,用相关函数法求出最后一个基音周期与它之前的一个基音周期的最大相关系数,以此确定复制段或删除段的最佳长度。以上两点的改进,大大改善了变调语音在相位连接点处相位不连续的问题。最后对算法在MATLAB环境下进行仿真,并用语音评价方法进行音效评估。实验结果表明,相对于SOLA-FS算法,新方法明显地改善了语音在连接点处相位不连续的问题,具有更好的变调效果。
其他文献
目的:探讨后发性白内障与人工晶状体材料之间的关系.方法:6只科研兔(体重2.5~4 kg,由大连医科大学动物中心提供)共12只眼,随机分为2组,每组6只眼.麻醉后行透明晶状体囊外摘除
随着计算机技术、自动化技术、工业组态技术的并向发展,机器视觉检测技术在自动化领域成为研究热点之一,并在工业生产、医学修复、逆向工程、人工智能以及飞行交通等领域得到
针对Ad hoc网络提出了一种新的媒体接入控制(MAC)协议——带有负载监听的多信道协议。它能够有效地解决多跳的Ad hoc网络中暴露节点的问题。在该协议中,每个节点都可以根据当前
国际学校的高三学生,面对语言/标化考试和国外升学的严苛要求,身体和心理也都出现过不同的应激反应,我们为学生选择了三个简单可行的技巧来随时调解身心焦虑。  肌肉放松疗法  情绪会造成神经紧张,如果能够放松肌肉,情绪压力也会得到宣泄。因此老师会在周三中午找一首舒缓的音乐,同学们自由地坐着或躺在地上,闭上眼睛,只关注呼吸。每次呼气时默数一次,默数到十后尝试把注意力集中在眉心,有意识地放松它,接着放松脸颊
期刊
采用有限元分析软件ANSYS模拟实际工况对操作控制台进行强度分析、模态分析和结构特性分析,通过环境试验验证分析结果的合理性。应用这种分析方法,可以为进一步的结构设计和
2020年春季,全国上下众志成城,齐心协力抗击疫情。山东省临沂市蒙阴县高都镇中心学校始终以"党建引领,铸魂育人"为指导思想,做好疫情期间"停课不停教、停课不停学"工作,做到
世界铁矿石烧结法发展现状[澳大利亚]P·R·道森第四部分烧结工艺1烧结能耗烧结生产所需能耗约占整个钢铁工业总能耗的6.7%。图1所示为有代表性的烧结能耗的变化情况。德国1989年的
在新冠肺炎疫情防控中,各行各业、各个岗位的劳动者们艰苦奋斗、勇于创新,劳动精神体现出独特的价值。前不久,中共中央、国务院印发了《关于全面加强新时代大中小学劳动教育
目的:评价硫酸镁联合小剂量阿司匹林治疗妊娠期高血压疾病的临床效果。方法:选取我院2012年11月至2015年11月收治的90例妊娠期高血压疾病患者作为研究对象。将这90例妊娠期高
运用文献资料法、问卷调查法等,揭示高职高专学生应激源、应付方式,旨在为体育教学制定培养策略提供依据。本文还就应激源、应付方式的现状,提出体育教学培养策略。