论文部分内容阅读
哼唱检索是一种基于内容的音乐检索方式,用户哼唱歌曲的一段,从中提取相关特征,利用音乐本身内涵,如节奏、旋律、和弦、伴奏甚至是音色,来搜索想要的歌曲,使用哼唱片段的音乐信息与音乐库中的音乐信息匹配,根据匹配相似度,得到检索结果。 目前已有一些国内网站和软件实现了音乐检索功能,但绝大多数演唱者无法检索到想要的结果,只有音准完全准确且哼唱速度稳定的专业演唱者才能得到较为准确的检索结果。因为大多数人在实际哼唱中,经常会出现唱歌添音、少音、音长不准以及音高不准等问题,导致哼唱的数据不准确,影响检索效果。 本文提出了短时特征提取法,这一方法利用了音乐中音高频率具有离散性这一特点进行研究,通过分析得出两个不同的音之间频率值相差较大,如果出现与标准音相差较小的值就是错误音,把出现的错误音通过计算进行处理,统一归到标准音高中,该方法有效解决了普通歌唱者易出现的音准较差的问题。本文在旋律匹配方面提出了与短时特征提取法相适应的二元匹配法,该方法有效避免了短时特征提取法中特征值太多导致的数据过多的问题。本文首次提出使用旋律特征之外的语音特征进行检索,对语音特征进行分析实验,尝试了文字匹配、音节匹配、声母匹配等,通过比较,使用声母匹配方法可以得到的正确率最高。对常见的易错音做了同化处理后,平均正确率达到75%。本文制作了一个100首歌曲的音乐库,该音乐库的歌曲只有主旋律,完全按照乐谱录入。最后,将旋律匹配结果与语音匹配结果相结合,进行加权计算,根据演唱者的类型赋予不同的权重来计算结果,音准较好的演唱者前五位命中率达到90%,音准不好的演唱者前五位命中率为65%。 本文介绍的方法与传统的旋律轮廓匹配法相比,音准不好的演唱者实现了哼唱检索,音准较好的演唱者的识别效率有了一定的提高。