歌声中旋律自动调整算法设计与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:mmlovejj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音处理技术有着广泛的应用领域,歌声旋律自动调整是语音处理技术的一个新的应用领域。对歌声旋律自动调整方法的研究在歌声评估、音乐教学、歌声纠正、娱乐等领域都有很大的应用价值。  歌声旋律包括声音的音高、音长和音强等三个属性。当前的研究主要集中在音高调整方面,大多研究是寻求对声音整体音高的提升和降低的方法,而对局部的音长、音强和音高调整的研究还比较少。针对这些问题,本文对歌声旋律的自动调整算法展开研究。  首先,本文研究了音高自动调整的算法,在时域和频域方面分别采用两个不同的算法。在时域方面,基于改变基音周期长度来改变基频的思想,本文采用依赖于基音标注的周期放缩法。在频域方面,基于平移频谱来改变基频的思想,本文采用不依赖于基音标注的频谱平移法。另外,本文设计出了音高调整的计算公式,可根据用户的原始音高和需要调整的比例精确地计算出要调整到的目标频率,这为音高调整的精确度提供了保证。实验表明,两种算法对音高调整非常有效,调整结果很好地保持了音频的原始音色。  在音长调整方面,本文在基音标注结果的基础上,采用通过增删完整的基音波形的方法达到调整音频时间长度的目的。实验表明,该方法在保证声音的音色等属性不被改变的前提下,可对音频做任意时长调整,而且算法具有很好的通用性。  对音强的调整,本文采用帧能量同步的方法,将标准音频的帧间能量变化趋势应用到用户音频上,使用户音频整体的音强变化与标准音频达到一致。实验表明,该方法可以满足大部分音强调整的需要。  最后,在旋律各属性自动调整算法的基础上,本文还设计了对歌声旋律的整体调整策略,达到以尽可能小的修改代价完成旋律调整的目的。通过使用这些策略,可有效避免对音频的不必要调整。
其他文献
目前,国内外垂直搜索引擎发展迅速,各行业各种类型的垂直搜索引擎如百花齐放。与传统搜索引擎相比,垂直搜索的一大特点就是需要对HTML页面进行信息抽取,但是实现通用自动的抽取系
语音识别即计算机自动语音识别,简单地说,就是让计算机能听懂人说话,将人说的话转换成计算机文本的一项技术。随着Internet和电子商务的飞速发展,语音识别技术将为网上会议、商业
语义Web和Web服务是WWW发展的两个重要趋势,这两种技术的结合产生了另一个新兴的研究课题——语义Web服务。语义Web服务是指用语义Web标记语言来描述服务的语义,并结合本体的
随着网络技术逐步应用到许多重要部门,安全协议是否能达到所要求的安全目标是非常关键的问题。借助形式化的方法或者工具是分析和检验安全协议性质的一个重要技术手段。GSPM(
由于森林火灾具有突发性和复杂性的特点,将计算机技术和数学建模技术应用于森林防火已成为必然的发展趋势。森林扑火方案是森林防火的重要组成部分,对于有效的组织扑救、减少
本文以协同工作平台服务系统CWPS研究开发为背景,结合Spring开发框架和中间件技术的思想,以面向对象/构件的方法为指导,建立共享接口网关软件构件模型,并运用设计模式等软件
信息产业的发展使信息安全越来越受到重视,而密码算法又是信息安全的基础与核心。自从高级加密标准AES(Advaced Encryption Standard)取代了数据加密标准DES(Data Encryption
HE-AAC(HighEfficiencyAdvancedAudioCoding)作为MPEG(运动图像专家组织)提出的下一代音频压缩标准,是目前最先进的音频压缩技术之一,被称为是21世纪的音频压缩标准。以智能电话、
NGN(NextGenerationNetwork,下一代网络)是基于分组技术的网络,能提供多种电信级业务,满足人们对各种新业务的需求。其中,在NGN上提供实时语音和多媒体业务是当前的热点。  与此
H.264/AVC视频压缩标准采用了几种变长码技术,例如指数哥伦布码和基于上下文自适应的变长编码。而在其参考软件中,这些变长码的解码算法对于理解标准的内容有很大的作用,但是在