面向大规模多媒体检索的深度哈希学习方法研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:z_clear
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网上多媒体数据的日益丰富,如何实现高效及精确的检索成了一个重要的问题。由于在检索效率和存储空间方面的优势,哈希方法近年来受到了学术界和工业界越来越多的关注,并被广泛应用于大规模多媒体数据的近似近邻查询中。大多数现有的哈希学习方法,首先会使用人工定义或学习得到的特征来表示多媒体数据,然后通过另外的哈希学习过程来生成最终的二值化哈希码。这类将特征抽取过程和哈希学习过程分开的方法,有一些明显的缺陷。首先,由于哈希码具有离散性,所以大部分哈希学习方法首先会学习得到一个连续压缩表示,然后通过量化函数来将连续的结果变成二值化的哈希码。然而,在二值化的过程中,量化误差通常会被忽略,这导致哈希学习的目标和最终的编码之间存在一定的差异。其次,由于分离了特征抽取步骤和哈希学习步骤,特征表示本身的质量,成了限制哈希编码表达能力的天花板。为了解决哈希学习中现存的问题,本文提出了一个深度哈希框架,来进行多媒体数据的哈希编码学习。相比于传统的方法,本文提出的深度哈希框架有三点优势。首先,由于深度网络能够进行特征学习,深度哈希方法能够提供从原始多媒体数据到哈希码的端到端学习方式,这解决了特征表示和哈希编码协同优化问题。其次,得益于深度神经网络强大的拟合能力,深度哈希方法能够学习得到高质量的从连续特征表示到离散哈希编码之间的非线性哈希映射函数,让哈希码尽量保持原始数据之间的相似关系。最后,本文在深度哈希框架中提出了量化损失的概念,让深度网络在训练过程中能够缩小连续的压缩表示和二值化的哈希码之间的差异,从而极大地提升了哈希码的表达能力和压缩比例。此外,本文在上述深度哈希框架中,利用贝叶斯估计创新性地提出了深度哈希网络(Deep Hashing Network,DHN)方法,来解决图片数据的哈希编码学习及大规模检索问题。最后,本文在Caffe和TensorFlow两个主流的深度学习框架中,实现了提出的深度哈希框架及深度哈希网络(DHN)方法,并通过一系列的实验,证明了提出的方法比之前的工作取得了显著的多媒体检索准确率的提升。
其他文献
以文化景观视角的提出为契机,对亚洲文化遗产的精神内核与物质载体进行了重新审视;参照国际组织相关类型划分标准与亚洲文明自身特点,分析了亚洲文化景观遗产的类型构成;并在
<正>创意的感性2006年夏天,天津大学体育馆的建筑设计概念方案原型刚被提出来的时候,它看起来就像是一艘降落在基地上的"飞船",这种想法来自于建筑师对概念工作模型的主观感
近年来,公众媒体上选民要求罢免人大代表的新闻日渐增多,说明我国选民政治参与意识在逐渐提高。但因选民提起罢免人大代表的要求而成功启动罢免程序,进而罢免成功的案例极少
写人类记叙文除了具有一般记叙文的共性特征之外,还有其自身的文本特征,即注重事件、注重细节、注重情节。在教学内容方面,要确定文本事件、细节描写、矛盾冲突。在教学策略
通过大量实地调研,对洞庭湖区农村住房中以绑扎工艺为主的建造方法进行了梳理,详细描述了该地区建房过程中常用植物的种类、特征、加工工具、建造工艺、维修方法等,为建造可
日本共产党在近年来的国政选举中一再败退,以2004年参议院议员改选为例,该次选举对共产党扭转颓势、稳固士气、拓展生存空间有重要影响,共产党选举前也作了大量准备工作,但选
<正> 我已在其他地方相当详尽地讨论了心理期待倾向的引发和随后的抑制在音乐经验的形成中所具有的重要性质。在对音乐经验作了分析之后我才发现,许多在分析中发展起来的概念
教学应从儿童出发,包括尊重学生的原有知识、经验、思维习惯等,当然也包含理解儿童的错误。这已成为广大教师的共识。如何避免从教师主观意愿出发的"伪儿童立场",需要追问:学
文章作者在教授音乐小学“视唱练耳课”过程中 ,根据儿童的生理和心理特点 ,摸索出一套将教学内容溶入游戏之中 ,让孩子们在轻松愉快的环境中学习的方法。这种寓教于乐的教学