【摘 要】
:
主旋律提取是音乐信息检索中的一个重要问题。音乐信息检索的目的在于将波形音乐文件转化为一串表征人声基频值的频率序列。基频作为一种重要的声学特征在诸多领域都有着重要
论文部分内容阅读
主旋律提取是音乐信息检索中的一个重要问题。音乐信息检索的目的在于将波形音乐文件转化为一串表征人声基频值的频率序列。基频作为一种重要的声学特征在诸多领域都有着重要的应用,因此主旋律提取在音乐信息交互上具有重要的地位。传统的主旋律提取方法中主要包含两个模块,候选基频提取和主基频判定。现阶段候选基频提取模块主要存在虚假基频过多的弊端,而主基频判定模块主要存在对时间帧内短时特征利用不充分,以及过分依赖旋律起始阶段提取准确性两个弊端。本文针对上述弊端做出改进,主要创新点包含以下两部分:1.提出了一种基于级联过滤的候选基频提取模块。这个系统包含三个部分,预处理部分,超傅里叶变换滤波部分及横纹滤波部分。首先,未经任何处理的原始信号中含有较大的成分的干扰源,我们利用乐曲重复性特点,采用先进音源分离方法对原始信号预处理,处理后的信号频谱中仍旧包含大量虚假基频,并且这些虚假基频多由伴奏信号和人声信号叠加产生的虚假峰值点产生,我们通过超傅里叶变换滤波,滤除频谱中伴奏声的频率分量,削减候选基频中非人声基频数量,最后我们认为原始的未进行能量映射的频谱保留了最接近原始声音信号的特征,我们利用横纹滤波模块滤除频谱中的离群点,野点候选基频簇及表现为平稳长直音的横纹候选基频簇,再一次大幅度削减候选基频中的非人声基频数。2.研究了基于人声帧判决的主基频判定方法。利用基于梅尔频率倒谱系数,谐波特征,频谱形状特征,谱对比度特征等特征进行训练的人声判决机器学习分类器。实验从单一特征,组合特征两个角度出发,寻找主旋律提取中人声准确率召回率表现相对较好的一组特征进行模型训练。在主基频判定模块中用以区分人声旋律线及非人声旋律线以提取最终的主旋律。
其他文献
电话口译是现如今常见的一种语言服务,主要以三方交谈的方式进行。因其不受地点限制,方便灵活且设备简单等特点越来越多地被应用。本文是一篇电话口译实践报告,主要描述了作
随着全球化的飞速发展,国际贸易在我国经济中所占比重不断加强,翻译在商业中发挥着越来越重要的作用。联络口译作为一种典型的口译方式在诸多领域广泛应用,包括外交、商务、
生产调度问题在现代的生活中得到广泛的应用,应用于社会生活中的多个领域,如工厂加工生产制造、钢铁铸造、淘宝、物流、网络通讯、计算机科学与技术等。经典调度问题在现实生
现今社会,国际交流日益频繁,宽带互联网使用便利,视听技术发展快速,这不仅为远程口译的发展奠定了良好的技术基础,而且提供了巨大的需求市场。近年来,作为一种新型的远程口译
贸易成本,指的是商品生产出来到传递至最终消费者过程中所产生的所有成本,它是决定贸易行为能否发生的重要因素。Deardorff(2004)认为,在存在贸易成本的情况下,传统的比较优
随着移动通信的发展,视频业务通信量呈爆炸式增长,给视频业务无线传输带来了前所未有的挑战。作为目前最热门的视频技术之一,DASH技术受到了国内外研究者的广泛关注。其码率
无线通信技术的飞速发展使得无线频谱的重要性与日俱增。无线频谱资源是一种短缺的、无法再生的公共资源。如何有效分配与合理使用该资源正成为学术与工业界研究的热点。拍卖
目的研究纳米羟基磷灰石/胶原即矿化胶原(nano-hydroxyapatite/collagen,NHAC)与镁钙合金(Mg-Ca)的联合支架材料应用于体外细胞实验中的生物相容性及其用于犬拔牙位点保存的
目的制备负载神经生长因子(NGF)的可注射壳聚糖透明质酸复合水凝胶,探讨其理化性能以及生物相容性。方法京尼平交联制备壳聚糖透明质酸复合水凝胶材料,采用倒置法检测复合水
随着移动互联网、云计算、移动通信等技术的发展,Internet上海量数据已呈几何级增长,大数据时代已经开启,分布式系统的规模和架构也因此发生了极大改变。互联网上数据多由半