海量音频指纹数据的存储与检索研究

来源 :天津大学 | 被引量 : 0次 | 上传用户：a673897736123

【摘要】

：

随着大数据时代的到来，尤其是包括图像、音频、视频在内的海量多媒体数据，这些数据亟需被有效地管理起来，并为广大用户提供方便、快捷的检索方式。随着模式识别、机器学习、云计

【作者】

：

王润涛

【机构】

：

天津大学

【出处】

：

天津大学

【发表日期】

：

2014年期

【关键词】

：

音频指纹海量数据存储与检索分布式存储

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着大数据时代的到来，尤其是包括图像、音频、视频在内的海量多媒体数据，这些数据亟需被有效地管理起来，并为广大用户提供方便、快捷的检索方式。随着模式识别、机器学习、云计算技术的发展，基于内容的多媒体检索技术应运而生，这种技术的出现使得信息检索不再依赖于数据的标签和关键字，而且搜索结果更为准确，搜索方式更为便捷。音频数据作为多媒体中重要组成部分，其数据规模也在迅速膨胀，人们面临的问题不再是缺少多媒体信息，而是如何在海量的数据中找到自己所需要的信息。如何快速有效的检索海量音频成为当前学术界和工业界信息检索研究领域的一个重要课题。音频指纹检索技术是基于音频内容的信息检索方式，通过对未知音频片段提取名为音频指纹的数字特征，然后在事先准备的海量音频指纹数据库中进行音频指纹的搜索与相似度计算，获得音频详细信息的方法。这种方法解决了传统基于文本关键字的搜索音频存在的文本标注不全、错误等问题，同时解决了用户不知道关键词时无从下手搜索的困难。音频指纹提取与匹配算法已经在实验室中取得了丰硕的成果，并在部分产品中得到了应用，但所处理的数据集规模相对较小。在应用到大规模数据集时会遇到性能瓶颈，以及并发性、扩展性等问题。本文在对音频指纹提取与匹配算法的深入研究基础上，对海量音频指纹数据的存储与检索进行了设计、实现及优化。首先提出了基于哈希结构的音频指纹存储结构，然后进一步提出了两种分布式哈希解决方案，并通过实验证明了所设计的方法的有效性。在此基础上，本文又提出了一种海量音频指纹数据的序列化分布式存储方案，并再一次通过实验证明了其有效性。本文所设计的存储结构和分布式存储检索方案具有多级并发、高性能、可容错、易扩展等特点，对于构建海量音频指纹检索系统具有实际价值，对于推进音频指纹检索技术在社会中的应用具有重要意义。

其他文献

SHJF本体的模块化重用研究

摘要：随着Web技术的快速发展和本体在计算机领域的广泛应用,本体的构建和维护必须达到更高水平,传统的从零开始构建本体的方式已经不能满足高质量大规模本体构建的要求。目前,

学位

本体模块描述逻辑SHJF本地性安全性模块重用

高速网络活跃节点检测与分类系统开发与实现

学位

E-Learning服务过程动态建模技术及其可视化开发环境的研发

20世纪60年代，第一个E-learning雏形系统计算机英语教学的出现，打破了传统课堂教育的限制，使得教与学不再只是面对面知识的传授。近几年来，随着互联网的迅速普及，E-learning在世界

学位

E-learning过程模型元模型元建模

基于CPK的Web服务认证系统的研究

Web服务是自描述的、平台无关的，它使用开放式标准，允许不同的应用程序进行交互。Web服务作为一种新兴的信息技术，形成了一种新的基于互联网的信息系统通用框架，允许用户远程调用

学位

组合公钥单双矩阵混合的组合公钥算法Web服务认证共谋攻击

一种企业移动信息服务平台中间件的研究设计

近几年，移动互联网蓬勃发展，为充分发挥移动互联网的优势，加快信息化建设，更好的服务移动用户，各企业以及各政府机构都意在构建自己的移动信息服务平台。通过企业内部的移动信息服

学位

数据抽取中间件会话同步

基于PA结构的语义信息抽取的研究

随着互联网的发展，互联网上的信息数量也在以指数的形式快速增长，这种海量的互联网数据具有极其重要的应用价值。但这种互联网数据具体其本身的异构性、随意性以及非语义性等特

学位

语义信息抽取PA结构本体语义角色标注浅层语义分析

基于嵌入式Linux的井下供风供水分站系统的设计与实现

煤矿井下供风供水系统是煤矿安全生产的重要组成部分，是煤矿安全生产运行中的必备工具，供风供水系统被称为煤矿井下的“生命线”。风水管道的漏损是供风供水系统中普遍存在的现

学位

供风供水Linux分站S3C2440CANCortex-M0

社交媒体多主题评价数据情感分析与可视化算法研究

学位

基于特征选择的多标签分类算法研究

随着网络的普及和计算机技术的发展，网上积累了大量的的数据。如何从海量数据中提取有用的信息或知识，并应用到相关领域成为了一个重要的研究课题。数据挖掘就是这样一种信息处

学位

数据挖掘多标签分类特征选择条件互信息

基于动态Vague集模糊多属性决策的研究

随着智能系统的进一步研究和发展，Vague集作为一种重要的软计算方法，其应用将会越来越广泛。针对目前Vague集的发展形势，本文研究的是动态Vague集模糊多属性决策分析，也就是它的

学位

Vague集动态模糊多属性决策TOPSIS灰色关联决策分析

海量音频指纹数据的存储与检索研究

与本文相关的学术论文