论文部分内容阅读
基于内容的音乐分析是计算机音乐智能处理领域的重要分支。本文面向音乐表达要素,以自动标注为核心研究了智能编辑和歌唱评价问题;结合提出的一组基于音乐知识的特征集,研究了面向内容属性的音乐聚类和分类方法。本文主要研究成果如下:1.面向多音轨乐器演奏,设计了一种基于自动标注和智能纠错的音乐编辑模型。该模型对乐谱和音频进行联合建模,采用DTW与自举学习分类算法相结合的音符切分算法,通过逐步求精的策略准确地判定音符边界。提出了一种感知音高提取算法。该算法以音高的稳定成分作为音符感知音高,避免了颤音和滑音的干扰。在智能编辑方面,提出了一种基于线性拟合的节奏抽取算法预测节拍位置。通过对音频信号的时间拉伸和音高平移同步各音轨的节拍点并校正音符音高。实验表明该模型提高了音乐总体的音质和听感效果。2.面向歌唱声音,提出了一种基于旋律和节奏特征的歌唱水平客观评测方法。提出了一种音符起始点检测算法,利用声韵母的时长和频谱特性较准确地界定了音符起始点。在旋律方面,利用演唱感知音高、乐谱移调音高以及相邻音符间的相对音程差来考察演唱音高的偏离程度。在节奏方面,使用节拍时长及其变化衡量实际演唱与参考节拍的偏离程度。通过与主观评测对比,验证了所提出的评测方法能够较准确地评价歌唱水平,自动评分结果与专家评分结果相关度较高。3.在音乐内容属性分析方面,提出了一组与音乐基本元素密切相关的乐理特征集。新特征描述了音高、和弦、音程在乐曲中的分布特性,能够反映音乐表达要素在音频中的体现方式。研究了非监督学习的音乐调性聚类,通过实验验证了乐理特征有助于全面刻画音乐在调性上的差异,从而让不同调性的乐曲可以被区分开来。提出了一种面向wav音频的音乐文化风格分类方法,进一步考察了不同特征在文化分类中的贡献。通过分析音乐在文化上的差异,采用监督学习方法实现了典型音乐文化风格的自动分类。实验表明在音色基础上结合乐理特征能够有效地识别音乐文化风格。