西洋乐器的音色识别

来源 :山东大学 | 被引量 : 0次 | 上传用户:meiyin1109
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乐器识别是音频信息检索领域中的重要研究方向之一,其主要目标是从乐音信号中分辨出乐器的所属类别和具体名称。音色的差异是区分不同乐器声音的根本依据,但现有的乐器识别算法通常使用大量的特征用于分类,往往忽略了探索乐器音色的本质。本文以音色信息的提取为出发点,对西洋乐器的识别问题展开了研究。合理的数学模型是音色特征提取的重要基础,本文总结了三种不同类别的乐音模型,并对常见的音色特征进行了简要介绍。激励源-滤波器模型以乐器的发声机制为基础,将乐音信号建模为激励源与共振体的卷积。乐器的音色主要由共振体的修饰作用决定,并可以通过倒谱分析进行有效提取。在倒频域特征中,梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient, MFCC)将乐器的发声机制与人耳的听觉特性相结合,更全面地诠释了音色的感知。本文将传统的激励源-滤波器模型加以改进,利用正弦成分和噪声成分的叠加对激励源信号建模,构建出对乐音信号描述更为详细的综合模型。受MFCC的启发,本文在综合模型的基础上提出了基于非音高成分的梅尔频率倒谱系数(Nontonal Mel Frequency Cepstral Coefficient, NMFCC)。非音高成分对应于噪声激励,此时提取出的共振体信息去除了激励源的影响,对音色的描述更加准确。此外,本文对经验模态分解(Empirical Mode Decomposition, EMD)得到的本征模态函数(Intrinsic Mode Function, IMF)进行筛选求和,提出了基于低阶本征模态和的梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient of Low Order Modes Summation, LOMS-MFCC),有效突出了乐音信号高频段的共振峰信息。本文通过大量的乐器分类实验,对NMFCC和LOMS-MFCC的音色描述能力进行了验证。与MFCC特征相比,本文提出的两种音色特征在乐器分类实验中性能均有明显改善。鉴于NMFCC令人满意的区分能力,论文最后将NMFCC特征和相关时域特征进行组合,使识别系统整体的识别正确率得到进一步提高。
其他文献
中国梨木虱(Psylla chinensis)遍布全国猖獗为害,对梨产量和品质造成极大威胁。梨木虱若虫在其分泌物的保护下生活、为害,药剂很难触及虫体杀死若虫,且对各类农药品种均可产
19世纪中叶以前,以西斯蒙第、约翰·穆勒、威廉·罗雪尔为主要代表的小资产阶级经济学家和资产阶级庸俗经济学家秉持调和折衷主义的学术理念,先后提出所谓"小农经济稳固论"、
<正>很久以前在朋友的签名中看到一句话:但行好事,莫问前程。当时看到这句话就很喜欢。有天老板把我叫到会议室,说以后你来带M吧,他向你汇报,正好我也想给你机会锻炼一下,试
期刊
汽车轮胎是汽车的重要总成之一,如何尽快认识和使用好轮胎,是汽车使用者非常关心的问题,本文从汽车轮胎的功用、结构和使用维护三个方面对轮胎相关实用知识进行了梳理,以帮助
采用美国产CI-340便携式光合测定系统对云杉光合特性进行分析,测定指标包括净光合速率(Pn)、气孔导度(C)、胞间CO2浓度(Ci)、蒸腾速率(E)、气温、空气湿度。结果表明:云杉具有午休现
广州日报讯(记者徐海星 通讯员穗府信、穗外事)昨日,首届中国-新西兰市长论坛在福建省厦门市举行。全国政协副主席马培华、新西兰驻华大使麦康年、中国人民对外友好协会会长李小
报纸
<正> 一、扣留李文林是富田事变的起因在江西苏区第一次反“围剿”前夕,发生了一起震动苏区的“富田事变。”关于“富田事变”的起因,有一些文章已经作了介绍,我认为富田事变
恐怖分子、资金、活动场所、行动纲领是恐怖主义组织的四个基本要素,恐怖组织发动恐怖袭击一般要经过策划、准备、实施、宣传等几个步骤。只有采取有力措施,针对恐怖组织的要
11月10日,中国船舶工业系统工程研究院、中船电子科技有限公司受邀参加由浙江省舟山群岛新区管委会、舟山市政府在京举办的海洋电子信息产业发展战略研讨会。会议期间,举行了海
报纸
提出一种行之有效的方法,在没有刀具磨损自动补偿功能的机床数控系统上,通过编程实现刀具磨损自动补偿功能。该方法在广州数控设备有限公司生产的CSK980TA与GSK980TE车床数控