钢琴乐音的音频分割算法研究

来源 :武汉工程大学 | 被引量 : 0次 | 上传用户:psyche_runner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展,网络信息中包含的音频、视频等多媒体信息比重越来越重,因而人们对多媒体信息的检索需求也日益增长。音频信息检索是多媒体信息检索的重要分支,其主要依据是听觉特征值。音频检索的前提是音频识别,而音频信息的结构化则是音频识别的重要步骤之一。音频信息结构化是指基于某种标准,将音频分割成长短不一,且在该标准下具有相同属性的独立片段,每一段音频信号都包含很多信息,从内容上可以分为三层——物理样本级、声学特征级和语义级,信息结构化一般是基于声学特征。本文通过研究大量基于内容的音频分割算法发现,现有的分割算法大都集中于音频不同类型片段的分割,对于同类型的音频片段自身,却没有更为精细的划分。这对于更高效的音频识别检索、乐谱分析等造成了负面影响。本文以钢琴乐音为研究对象,提出了一种新的基于方差加权和的音频分割算法实现钢琴乐音的独立音符分割。该算法结合了基于贝叶斯准则(Bayesian Information Criterion,BIC)和信息熵的音频分割算法的思想,以同类型的钢琴乐自身音符分割为目的,其结果甚至可以为语义识别、分析等提供所需的结构化信息。该算法针对单手弹奏的纯钢琴乐音效果显著,对于自然环境下录制的钢琴入门曲,可以有效地分割出每一个独立音符,为之后的乐谱识别和语义分析提供数据基础。由于现实生活中,钢琴音乐大都为双手同时演奏,因此本文所提出的基于方差加权和的音频分割算法需要通过预处理,即对混音信号进行盲分离后才能适用。针对这种情况,本文采用了独立分量分析(Independent Component Analysis, ICA)的信号分离算法,并分析了常用线性函数对音频信号分离的不同影响。实验表明,将两段单独录制的单手弹奏的钢琴音乐,混音后经ICA算法分离,得到的分离信号基本与原录制信号一致。因而,经过ICA分离后的混音信号,可以使用方差加权和算法进行后续分割。至此,双手弹奏的钢琴乐实现了独立音符的分割,并达到了良好的效果。
其他文献
化学是中职卫生学校学生的重要基础课程之一,它不仅为学生学习后续医学基础课(生物化学、生理学、药理学等)打基础,而且在今后的护理工作中也将发挥重要的作用.然而,近年来我
艺术创作不仅是对美术理论及美术实践的科学总结,还可以从多个角度反映出美术工作研究的相应成果.随着学术界研究工作的深入开展,美术理论逐渐形成了相对完整的理论体系,全面
近年来,我国卫星发射数量逐渐增多,遥感数据量呈现爆炸性增长的趋势,遥感数据分发共享变得日益紧迫。遥感数据同步在遥感数据分发共享中占重要地位,其作用是分布式同步异构数
媒体任何一次活动,归根到底都是一次创意活动,让所有电视从业人员都应把创意当作自己创作过程中一个必须认真考虑的环节,并且知道从哪里开始。经常有人把创意想得很离奇,认为
无线网状网(WMN:Wireless Mesh Network)是基于无线自组网发展而来的一种相对静态的无线网状网络。无线网状网是不同于以往任何一种有线或无线的网络技术,它的技术关键是通过
就目前中国的艺术设计专业而言,我们不但要传授关于中国画课程教学的专业知识与绘画技巧,更重要的是对学生的专业素质和综合素养进行培养.这有助于提高艺术专业学生的艺术审
我是1982年担任新闻干事的,先是在团场,后调到师宣传处。几年来,我在工作中深深体会到:集体采写是提高通讯员素质,搞好通讯队伍建设的一项重要措施。在150团场刚当新闻干事
计算机视觉(Computer Vision)是研究如何使机器对多维图像数据产生智能感知的科学。目标对象检测识别属于基础领域研究,对图像理解至关重要。有效的目标对象检测识别算法框架
细胞是生物体结构和功能的基本单位,而最能表明一个细胞特殊功能的是细胞器的种类和数量.许多细胞类试题的考查,往往与细胞器的知识密切相关.rn一、对细胞器的认识rn所谓细胞
高校进行美术教育的目的是为了培养优秀的美术教师,将高校的美术教学加以完善,增强培养美术专业学生的教学能力,能够为今后的美术事业培养出优秀的人才.在高校实际的美术课程