论文部分内容阅读
语音处理技术有着广泛的应用领域,歌声旋律自动调整是语音处理技术的一个新的应用领域。对歌声旋律自动调整方法的研究在歌声评估、音乐教学、歌声纠正、娱乐等领域都有很大的应用价值。 歌声旋律包括声音的音高、音长和音强等三个属性。当前的研究主要集中在音高调整方面,大多研究是寻求对声音整体音高的提升和降低的方法,而对局部的音长、音强和音高调整的研究还比较少。针对这些问题,本文对歌声旋律的自动调整算法展开研究。 首先,本文研究了音高自动调整的算法,在时域和频域方面分别采用两个不同的算法。在时域方面,基于改变基音周期长度来改变基频的思想,本文采用依赖于基音标注的周期放缩法。在频域方面,基于平移频谱来改变基频的思想,本文采用不依赖于基音标注的频谱平移法。另外,本文设计出了音高调整的计算公式,可根据用户的原始音高和需要调整的比例精确地计算出要调整到的目标频率,这为音高调整的精确度提供了保证。实验表明,两种算法对音高调整非常有效,调整结果很好地保持了音频的原始音色。 在音长调整方面,本文在基音标注结果的基础上,采用通过增删完整的基音波形的方法达到调整音频时间长度的目的。实验表明,该方法在保证声音的音色等属性不被改变的前提下,可对音频做任意时长调整,而且算法具有很好的通用性。 对音强的调整,本文采用帧能量同步的方法,将标准音频的帧间能量变化趋势应用到用户音频上,使用户音频整体的音强变化与标准音频达到一致。实验表明,该方法可以满足大部分音强调整的需要。 最后,在旋律各属性自动调整算法的基础上,本文还设计了对歌声旋律的整体调整策略,达到以尽可能小的修改代价完成旋律调整的目的。通过使用这些策略,可有效避免对音频的不必要调整。