基于Hadoop和Lucene的CBIR系统的设计与实现

被引量 : 0次 | 上传用户:javaname39
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网和多媒体技术的发展,全球的数字图像呈爆炸性增长,传统的基于文本的图像检索(TBIR)技术已无法满足人们的需求。因此,研究和开发基于内容的图像检索(content-based image retrieval, CBIR)系统逐渐成为了工业界和学术界的热点。Hadoop是Apache软件基金会旗下的一个开源分布式软件,由HDFS和MapReduce两大部分组成。由于强大的海量数据存储与处理能力,近几年,Hadoop在计算技术的各个领域都得到了广泛的应用。在构建CBIR系统的过程中,比如图像特征提取、特征数据存储、索引创建等过程,数据量和计算量都十分巨大。因此,基于Hadoop构建一个分布式CBIR系统有着重要的研究价值和广阔的应用前景。本文结合作者在焦点科技股份有限公司搜索组的实习经历,介绍了参与的一款CBIR系统项目的设计与实现。该CBIR系统可分为存储系统、特征提取系统、索引系统和查询系统四大模块,主要特点是:开创性地把Hadoop引入CBIR系统的构建以克服大数据量带来的性能瓶颈,并基于倒排索引和Lucene构建了索引和查询系统。作者在该项目中主要负责系统总体设计,特征提取系统和查询系统的实现以及各模块的整合。本文前两章分别介绍了CBIR技术的研究现状和系统中所用到的关键技术。第三章分析了系统的需求并分模块介绍了系统的设计:存储系统部分介绍了图像数据库、图像特征数据库和索引库的设计;特征提取系统部分介绍了特征提取算法的设计、特征入库的执行流程并给出了该系统的静态和动态视图;索引系统部分介绍了索引创建的流程和该系统的静态视图;查询系统部分给出了静态和动态视图,并简单介绍了用户界面的设计。第四章按照第三章的顺序以表格和代码的形式依次叙述了各模块的实现,然后简介了该项目测试环境的搭建并展示了原型系统的运行效果。最后一章对项目的工作做了总结并展望了未来。
其他文献
本研究以米团花花为研究对象,优化黄色素的提取条件;分析干花中的挥发性成分;分离、纯化黄色素组分;通过毒理学实验鉴定其安全性。(1)在单因素实验的基础上,利用响应面法对微波辅助
数字城市是城市信息化的重要组成部分,随着信息技术的发展,对数字城市三维模型提出了更高的要求,而现有的三维建模手段不能满足这种需求。BIM技术的发展为数字城市三维模型建
目的:研究pKi67在增生性瘢痕和瘢痕疙瘩组织中的表达水平和分布特点,探讨病理性瘢痕中细胞增殖的特征,协助鉴别诊断。 对象与方法:应用兔抗人Ki67多克隆抗体,对21例增生性瘢痕,1
近年来,校园安全事故频发引起了社会的关注和教育部门的重视,校园安全得到了一定的加强。但是学生在校园之外(由家到学校路途中)的安全却是教育服务内容上的一项空白。2011年11月
本届展览会共有来自德国、意大利、日本、新加坡、中国以及中国香港、中国台湾地区的27家针织大圆机生产厂商参展,共展出各种类型针织圆纬机70台,其中包括电脑控制选针(提花、
目的探讨妊娠合并重度子痫前期行剖宫产手术患者的临床护理体会。方法选取我院2016年1月~2017年1月收治的50例重度子痫前期患者为研究对象,对所有患者进行精心护理,观察其临
每位家长都希望自己的孩子是个文明的孩子,可是有些孩子还是时不时地冒出一些脏话,而且屡禁不止,这令家长十分不悦和头疼。面对孩子说 Every parent wants his child to be
期刊
皮肤撕脱伤是整形外科常见创伤之一,撕脱组织继发性坏死机理的不明及对撕脱组织血运缺乏有效的判断方法,是目前影响其救治效果的重要原因。本课题通过对皮肤撕脱伤撕脱组织和血
前言 瘢痕是组织进行修复后的产物,瘢痕一方面影响外观,瘢痕挛缩还可以造成关节活动障碍,给人们生活带来极大不便。烧伤后的瘢痕多为增生性,于创面愈合6个月后生长达到高峰。
目的采用SYBR Green I荧光定量PCR检测血清miR-21表达量,评价血清miR-21对糖尿病肾病的诊断价值,以确定血清miR-21作为糖尿病肾病早期诊断的分子标志物。方法1.对25例糖尿病肾