基于感知哈希技术的音频检索方案研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:nickyhuang00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术和多媒体技术的迅速发展,从网络上获得的多媒体信息的数量越来越多,如何从海量的媒体信息中迅速有效地检索出所需要的信息就变得越来越重要。由于音频信息是一类非常重要的多媒体信息,音频信息检索的研究逐渐受到重视,其中基于内容的音频检索技术迅速发展起来,成为当前的热点研究问题。目前大多数基于内容的音频检索系统都在预处理阶段将音频分割和分类,音频库中的音频通常只有几秒或十几秒的长度,系统将音频分成简单的几个类别,与实际应用还相差甚远。也有少数系统通过直接使用音频物理特征计算音频间相似度的方式来完成检索,但是这类方法往往计算量大,检索性能较低。更重要的是,现有的音频检索系统都没有考虑同一内容的音频在不同格式下的差异,音频在某些格式下的版本不能被检索出来。此外,如何对系统中音频的进行版权保护这一问题也没有引起研究者的广泛重视。本文针对以上音频检索研究中的不足,将新兴的感知哈希技术引入到音频检索中。开展了以下方面的研究:首先,根据音频感知哈希串的特点,对哈希串提取摘要,提出了基于N-Gram索引的two-stage检索算法,最终实现了音频检索的原型系统,通过设定适当的阈值,可以达到100%的查全率、查准率和Top-1命中率。其次,通过对感知哈希技术和音频检索需求的研究,本文提出了一种新的基于子带能量的感知哈希算法,实验表明,该算法具有很好的鲁棒性和抗碰撞性,在保持优良检索性能的同时减少了检索的数据量和存储量,缩短了检索时间。此外,在音频版权保护方面,本文根据感知哈希串的安全性和抗碰撞性,提出了一种应用于检索系统中的版权保护机制,并根据感知哈希串的统计信息,提出了哈希网络和哈希网络特征向量的概念,实现了版权信息的快速判定。
其他文献
由于城市地下管线的增多和各大城市地铁建设的加快,道路塌陷的事故越来越多的发生在我们的生活中,逐渐成为城市生活中一个看不到的隐患,随时对人民的生活产生着威胁。人们对城市
人脸验证是计算机识别领域非常活跃的研究课题,它包括三个主要技术环节,即预处理、人脸特征提取和分类器设计。人脸特征提取又称为人脸表述,是在低维特征空间内对原高维空间
随着数据时代的到来,各行各业所产生的数据呈指数级增长,数据的多样性和爆发式增长给数据存储和传输带来了巨大压力,严重阻碍了高性能计算在科学领域的运用和发展。数据压缩一直
目前,能否有效解决在软件项目开发及维护过程中出现的各种各样的问题已成为影响软件项目成败的重要因素,因此,有必要结合现代项目管理知识和企业问题管理模式对软件项目问题进行
随着我国经济建设的快速发展,国家对基础设施建设投入逐步增大。与此同时,大型工程项目中各种复杂的项目信息、数据需要动态管理,以实现各成员之间的资源共享、任务分配、协
全局优化问题,特别是组合优化问题,是科学研究与工程计算中最基本的问题之一,这类问题的求解一直是算法研究领域的热点问题。全局优化方法一般分为确定型和随机型方法,确定型
非线性科学是一门研究非线性现象共性的基础科学,其中混沌理论是非线性科学的一个重要分支。本文利用数值模拟的方法对混沌密码学进行了研究,主要内容如下:提出了一种基于一
经过近十年的发展,云计算正在当今的互联网络时代中扮演着重要的角色,它已经成为一场改变IT格局的划时代变革,颠覆性地改变着当今信息产业的发展方式,风起云涌的云计算发展浪潮正
人们生活的现代社会是由计算机信息网络、电话通信网络、物流分派网络、运输服务网络等等各种网络组成的一个复杂的网络系统。随着研究对象的日益复杂化,一些传统的基于精确
随着网络技术的迅速发展和J2EE平台的广泛应用,基于B/S的多层Web体系结构正在不断的发展完善,并逐渐成为Web应用开发的主流。但是,即使利用最先进的软件平台J2EE,开发Web应用