【摘 要】
:
随着数字图像信息的爆炸式增长,用户对多媒体搜索的需求也越来越强烈。传统的图像检索技术,是利用图像周围的文本信息对数据库进行检索,但由于视觉特征与文本特征之间存在着
论文部分内容阅读
随着数字图像信息的爆炸式增长,用户对多媒体搜索的需求也越来越强烈。传统的图像检索技术,是利用图像周围的文本信息对数据库进行检索,但由于视觉特征与文本特征之间存在着“语义鸿沟”,很容易影响搜索结果的相关性,因此基于内容的图像检索逐渐成为计算机视觉领域的研究热点。传统的bag of features图像检索模型对于图像检索存在两方面的问题:一是高维视觉特征被量化为视觉关键字时因降维而带来的信息丢失,导致特征的区分力下降;二是bag of features模型将图片看作是视觉关键字的集合,忽略了特征之间的空间位置关系。本课题针对第一个问题,基于bag of features模型,通过结合SIFT与CS-LBP特征描述符,提出了基于双关键字索引的图像检索模型。在双关键字图像检索模型中,利用SIFT与CS-LBP两种特征描述同一特征区域,可有效提高视觉关键字的区分力,弥补特征量化的精度损失。同时双关键字检索模型使用双码书实现特征量化,在同等关键字规模的条件下,可有效减少量化时间。为了提高搜索的准确率,本文提出了基于双关键字检索模型的海明码嵌入技术与基于距离权重的软量化技术,并通过实验证明这些技术有效增强了双关键字图像检索模型。同时,本文以双关键字图像检索模型实现了基于内容的图像检索系统,并以检索系统为平台开发了移动客户端的专辑搜索应用。在实验部分,本文利用INRIA Holidays标准数据集在120K规模的数据库上将双关键字检索算法与原始bag of features模型进行了对比,实验结果表明双关键字图像检索模型有效提高了系统的搜索准确率,在运行时间上也满足系统的实时需求。
其他文献
最近几年,随着经济的发展,科学技术的进步,计算机视觉技术和多媒体处理技术得到了迅猛的发展,目标检测与跟踪技术的研究成为了计算机视觉领域的两个重要课题,是更高层次视觉
利用OpenAPI,将Inernet上的碎片化数据混搭在一起构建新型的应用,已成为当前Web应用开发中的一种潮流和趋势。然而,开发人员在搭建Mashup应用时面临诸多困难和挑战。本文旨在
智能视频监控领域的行人流量统计技术是指采用基于计算机视觉的方法统计某一时间段内出入某个通道的行人流量。因其高度的适应性和非侵入性,该技术可以自然融入到已广泛使用的
在石油勘探和开发过程中,为了评价储层的好坏,需对井下取得的储层岩石样品进行孔隙结构分析,其中储层结构分析所需的主要参数是由毛管压力曲线确定的。所以,岩石毛管压力曲线
在网络信息时代,随着通信技术的不断发展,即时通信得到了广泛应用,产生了巨大的短消息数据,短消息数据中蕴藏了大量有用信息资源,如何对短消息数据进行采集、存储、分析和挖掘,对于
随着计算机技术,特别是Internet的迅速发展,可共享的资源越来越多,各种Web数据库中已经存放了涵盖各个领域的大量有价值的信息,成为人们获取信息的主要渠道。然而由于Web数据库所
近年期货公司发展迅猛,势头强劲,期货公司用于服务个人用户和其他实体企业的系统平台成为整个期货行业的迫切需求,本项目正是在此背景下研发的。本文的目标是为期货公司开发
监控环境的多样性和复杂性导致视频分析算法的鲁棒性较差,对于复杂的算法,在嵌入式环境下也不能满足实时性需求。为了使得视频分析算法适合应用于嵌入式环境,本文主要研究嵌
无线传感器网络是一个热点的研究领域。随机分布的大量传感器节点,以无线的方式构成网络,感知各种物理参数并将数据汇聚到数据管理中心。为了满足远程管理的需要,数据管理中
随着互联网技术的发展和信息量的迅速增长,人们迫切需要一种准确、高效的信息获取方式。从搜索引擎到智能交互式问答系统,信息的获取方式越来越接近于自然交互。一方面因为海