论文部分内容阅读
伴随着计算机自动化技术的高速发展,以自动记谱技术来替代人工记谱成为了当下计算机音乐研究者的一个热门研究点。它不仅仅解放了音乐家的记谱工作,还可以进行快速的记谱。本文就作者开发的自动记谱系统而展开,主要针对哼唱信号的音符切分做出了如下研究:1.提出一种以人主观听觉为依据的哼唱音符手工标注标准。即将一段哼唱信号视为一个听觉成分序列。在此基础上制定由听觉成分序列组成的音符块的识别规则。利用此规则构造一种ATN网络,实现对哼唱信号的自动切割,以获得连续的音符块序列。针对每个音符块包含的不同听觉成分以及音符块内的信号帧的基频,建立相应的音符块的音高估算模型。2.在音乐家手工标注的哼唱信号中,如果其中某段哼唱信号区域包含2个及以上音高均相同的相邻音符块,那么该段信号区域的相邻音块的边界切割技术需主要以该区域的信号帧的能量变化特征为依据。课题组前期采用的方法是把人工观察、收集经音乐家手工标注的音符边界的信号帧能量变化作为音符边界的能量变化阈值。但这种方法因手工分析数据的有限性常使设计的算法“顾此失彼”。特别在长RS区(含6帧以上且听觉成分为音高稳定区的哼唱信号区域)中,若听觉认定该区域为包含相同音高的连续音块,则切分程序常出现漏切、误切的情况。针对此问题,本文分析与比较了音乐家手工标注好的数据,提出一种基于信号帧能量跃升的分析模型。并对一定数量的手工标注歌曲进行数据的训练。增加一层“过滤”程序,在已切分好的并且符合规定范围内的音符区域进行二次切分。减小漏切、误切的情况,提高了切分正确率。这一改进使算法对38首公共测试数据的音符估算平均正确率从原先的45.39%提高到目前的51.72%。按Emilio Molina的评估框架,与基于HMM方法的Ryynanen所取得的最好结果不相伯仲。但我们的方法在基频估算上不使用YIN算法,具有以实时估算音符音高的优势。3.在哼唱片段调性层面,通过分析相邻哼唱音符的音程,估算最匹配哼唱片段的调性。以调性音级推算音符音高实现期望哼唱旋律的估算。最后,通过比较传统的实际哼唱旋律的估算与本文的基于调性分析的期望哼唱旋律的估算,建立新的哼唱旋律估算的评估法。新评估法涉及描述哼唱旋律线准确度的演算音程正确率与反映系统的自动校正能力的校正音程正确率。4.提出了一种性能评估模型,通过对比分析实验结果,分析了上述切分算法的可靠性与正确性。经过以上步骤,实现出了一个自动记谱系统,在一定程度上可以代替记谱专家的手工记谱工作,在计算机音乐的研究与实际记谱上都存在一定的使用价值。