基于云平台的大规模图像检索研究

来源 :北京交通大学 | 被引量 : 3次 | 上传用户:wuxiangff
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网、多媒体技术以及计算机视觉的快速发展,衍生出了大量的多媒体数据,这些数据多以图像、视频的形式呈现。一方面这些图像充斥于数字网络中给人们提供了丰富的共享资源和绚丽的视觉体验,另一方面,在面对纷繁复杂的海量图像时如何对其进行组织和管理,并快速准确的挖掘出我们所需要的信息成为一个现实而紧迫的问题。尽管图像检索从初期的基于文本关键词发展到了基于图像内容的检索(Content-based image retrieval,CBIR)方式,但是大数据环境下以图搜图的检索方式不仅继承了 CBIR的难点,包括特征描述的区分度,特征匹配的精确度和复杂度等,更催生了一些新的问题。因此一种基于内容的实现图像快速检索、并行处理、及时响应的图像检索方法成为了研究热点。于是,伴随大数据而生的云平台成了人们解决问题的一个新方向。作为面向研究者的开源平台,Hadoop因其独特的计算与存储优势,也开始被研究者用来解决各种问题。鉴于上述问题,本文开展了基于云平台Hadoop进行大规模图像检索的问题研究,利用Hadoop平台实现大规模图像的并行检索。本文将图像检索分为两个阶段:第一阶段是基于中层特征二值Fisher向量得到候选图像集合的"粗筛选"阶段;第二阶段是基于底层特征SIFT特征对候选图像集合进行重排序得到图像检索结果的"细排序"阶段。论文的主要工作包括如下几方面:(1)提出图像特征描述文件的合并存储,减少Hadoop对小文件的处理开销;提出对全局特征描述子Fisher向量的二值化表达,加速大数据环境下的图像特征比对;提出了分布式环境下缓存查询图像特征的实现方法,减少I/O访问量。在此基础上,在Holidays、Kentucky、FlickrlM数据集上进行了云平台Hadoop下的并行图像检索实验,并从文件组织方式、图像检索效率和图像检索准确率三个方面进行了分析与总结。(2)为了对比云平台下的图像检索,在单机上进行了基于倒排索引的图像检索测试,分别在Holidays、Kentucky、FlickrlM数据集上进行了单机下的图像检索实验。(3)将单机下的图像检索与云平台下的图像检索针对扩展性与实验性能两个方面进行了详细分析与深入讨论。实验表明,将Fisher向量和SIFT特征作为图像特征描述方式,云平台Hadoop下的大规模图像检索能够取得良好的图像检索效果,而且云平台下的图像检索可扩展性好且对一般图像的检索问题具有很好的适用性。因此,云平台下的图像检索具有广泛的应用前景及良好的发展趋势。
其他文献
现今,由于信息的存储、传输和处理越来越多地在开放网络上进行,信息易受到窃听、截取、篡改、伪造和重放等各种攻击手段的威胁。在现代的制造业生产流程中,企业与企业之间、部门
近些年来,随着生产制造企业网络规模的不断扩大,对网络的管理变得越来越困难。加上工业网络所处的特殊的环境,很容易造成设备故障,从而给企业带来经济损失甚至是人员伤亡。如
BBS作为一种新兴的交互性强的媒体,越来越受到网民的青睐,成为了新闻、观点和民声的集散地,是网民获取信息和发表评论的重要渠道之一。BBS上的发帖和回帖都围绕一个个话题,而这些
本论文中的应用程序使用C#语言编程实现,该应用程序可以计算往返时间,并能够提供有关数据传输和连接稳定性的信息数据,这些功能对于从事网络管理的工作人员非常有用。   由于
视频运动目标跟踪是当前计算机视觉领域最活跃的研究主题,作为一门跨学科的前沿技术,它融合了图像处理、模式识别、人工智能等多种不同领域的理论知识,广泛应用于军事和民用方面
中文分词是中文信息处理领域的一项基础性课题,未登录词识别问题又是中文分词的瓶颈问题之一。为了解决中文分词中的未登录词识别效率低下的问题,本文在分析现有未登录词识别
统计机器翻译是自然语言处理领域具有挑战性的前沿课题之一,具有广泛应用价值和重要的商业应用前景。随着网络技术的发展和普及,信息量快速增加,各领域对机器翻译的需求量也
同步自动机是一种特殊的有限状态自动机,在机器人学、工业自动化以及生物计算等方面有重要应用,同步性检测和最短同步字的长度(特别是(?)ern(?)猜想)是同步自动机理论研究的两个核心
目前处理器持续增长的温度已经成为芯片设计的主要瓶颈之一。求解热方程最常用的方法是有限差分法(Finite Difference Method,简称FDM)和有限元法(Finite Element Method,简
作为当今计算机发展炙手可热的技术,并行计算及以其为基础的云计算已经成为了解决大数据量,复杂运算问题的首选方法,越来越多的应用被从单机搬到了云端。并行计算的发展使得我们