海量音频指纹数据的存储与检索研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:a673897736123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,尤其是包括图像、音频、视频在内的海量多媒体数据,这些数据亟需被有效地管理起来,并为广大用户提供方便、快捷的检索方式。随着模式识别、机器学习、云计算技术的发展,基于内容的多媒体检索技术应运而生,这种技术的出现使得信息检索不再依赖于数据的标签和关键字,而且搜索结果更为准确,搜索方式更为便捷。音频数据作为多媒体中重要组成部分,其数据规模也在迅速膨胀,人们面临的问题不再是缺少多媒体信息,而是如何在海量的数据中找到自己所需要的信息。如何快速有效的检索海量音频成为当前学术界和工业界信息检索研究领域的一个重要课题。音频指纹检索技术是基于音频内容的信息检索方式,通过对未知音频片段提取名为音频指纹的数字特征,然后在事先准备的海量音频指纹数据库中进行音频指纹的搜索与相似度计算,获得音频详细信息的方法。这种方法解决了传统基于文本关键字的搜索音频存在的文本标注不全、错误等问题,同时解决了用户不知道关键词时无从下手搜索的困难。音频指纹提取与匹配算法已经在实验室中取得了丰硕的成果,并在部分产品中得到了应用,但所处理的数据集规模相对较小。在应用到大规模数据集时会遇到性能瓶颈,以及并发性、扩展性等问题。本文在对音频指纹提取与匹配算法的深入研究基础上,对海量音频指纹数据的存储与检索进行了设计、实现及优化。首先提出了基于哈希结构的音频指纹存储结构,然后进一步提出了两种分布式哈希解决方案,并通过实验证明了所设计的方法的有效性。在此基础上,本文又提出了一种海量音频指纹数据的序列化分布式存储方案,并再一次通过实验证明了其有效性。本文所设计的存储结构和分布式存储检索方案具有多级并发、高性能、可容错、易扩展等特点,对于构建海量音频指纹检索系统具有实际价值,对于推进音频指纹检索技术在社会中的应用具有重要意义。
其他文献
摘要:随着Web技术的快速发展和本体在计算机领域的广泛应用,本体的构建和维护必须达到更高水平,传统的从零开始构建本体的方式已经不能满足高质量大规模本体构建的要求。目前,
学位
20世纪60年代,第一个E-learning雏形系统计算机英语教学的出现,打破了传统课堂教育的限制,使得教与学不再只是面对面知识的传授。近几年来,随着互联网的迅速普及,E-learning在世界
Web服务是自描述的、平台无关的,它使用开放式标准,允许不同的应用程序进行交互。Web服务作为一种新兴的信息技术,形成了一种新的基于互联网的信息系统通用框架,允许用户远程调用
近几年,移动互联网蓬勃发展,为充分发挥移动互联网的优势,加快信息化建设,更好的服务移动用户,各企业以及各政府机构都意在构建自己的移动信息服务平台。通过企业内部的移动信息服
随着互联网的发展,互联网上的信息数量也在以指数的形式快速增长,这种海量的互联网数据具有极其重要的应用价值。但这种互联网数据具体其本身的异构性、随意性以及非语义性等特
煤矿井下供风供水系统是煤矿安全生产的重要组成部分,是煤矿安全生产运行中的必备工具,供风供水系统被称为煤矿井下的“生命线”。风水管道的漏损是供风供水系统中普遍存在的现
学位
随着网络的普及和计算机技术的发展,网上积累了大量的的数据。如何从海量数据中提取有用的信息或知识,并应用到相关领域成为了一个重要的研究课题。数据挖掘就是这样一种信息处
随着智能系统的进一步研究和发展,Vague集作为一种重要的软计算方法,其应用将会越来越广泛。针对目前Vague集的发展形势,本文研究的是动态Vague集模糊多属性决策分析,也就是它的