基于网络监督的地标图像的搜集与标记研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:vay_b
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络的发展为我们带来了丰富的视觉信息,利用图像搜索引擎可以搜集到成千上万的图像,这其中包含有大量的各地风景名胜图像,它们从各种视角、各种季节、各种时段展现着旅游名胜的美。如何对这些风景图像进行结构化组织是网络视觉研究的一个热点问题。本文针对地标风景图像进行了深入的研究,按视觉一致性对地标图像进行聚类,进行地标图像的摘要,并对地标进行定位。该研究对地标的三维重建、地标图像的浏览具有重要的作用。本文的研究工作和学术贡献如下:   1.提出一种按空间分布结合语义的地标图像组织和过滤方法。针对网络引擎搜集的噪声图像集,利用GIST描述子对图像进行全局特征描述,然后设计分层聚类方法对图像进行聚类。对得到的图像聚类集合,利用局部特征描述子SIFT对关键点进行描述,并结合RANSAC算法和词袋模型思想,进行图像集的几何一致性验证和共性特征提取,过滤噪声图像,同时为图像集挑选出一张地标图像(Iconic Image)作为该集合的摘要。   2.提出一种基于视觉词词频挖掘的地标定位方法。在得到的各类地标聚类集合上,利用SIFT特征计算具有视觉一致性及空间一致性的兴趣点,并且设计出一种提取含有最关键信息的兴趣点的方法,然后通过这些兴趣点的位置,结合图割技术(GrabCut),预测地标的位置。   3.在假设地标聚类集合含有地标的前提下,提出了两种基于监督的地标定位算法。第一种方法,将地标定位问题转化为弱监督目标的分类问题:首先采用基于兴趣点的双模板对图像进行GrabCut分割,接着利用多示例学习思想对分割结果进行半监督分类,最后从分割结果中筛选出对地标的最优标记。第二种方法,将地标定位问题转化为集合内部元素的近邻匹配问题:首先利用兴趣点匹配技术大致标记目标的位置,接着通过GrabCut对标记结果进行优化,最后结合地标面比特征实现对地标的最优标记。   将本文算法应用于从网络检索到的四类地标图像上。在地标图像的组织方面,本文算法取得了较好的效果,能将主观视觉上具有空间及语义一致的地标类聚合在一起;在图像过滤方面,本文算法对正确地标图像的平均查准率达到89.52%,而利用关键词从网络搜索得到的地标图像集的平均精度为27.97%:在地标定位方面,基于词频挖掘的地标定位方法最高达到95.35%的标记精度,基于弱监督学习的地标定位方法最高达到90.91%的标记精度,基于近邻匹配的地标定位方法最高达到95.74%的标记精度。实验结果证明了本文所提算法的有效性。
其他文献
近年来,全球信息化和经济全球化已经成为时代的发展潮流,研究新的宽带业务,开发网络多媒体应用,提高人们的生活质量,已经为全世界共同关注的问题。宽带业务与多媒体信息的主体是图
纹理是自然界物体表面的一种基本属性,在现实生活中,对纹理的视觉感知是人类认识世界的重要依据。由于三维表面纹理在不同光照条件、不同视觉角度下的表现不尽相同,对其内在
无线传感器网络(Wireless Sensor Network:WSN)是由布置在监测区域内大量的传感器节点通过无线通信方式形成的一个多跳的自组织网络系统,其目的是协作地感知、采集和处理网络
量子密码或量子密钥分配(QKD)基于量子物理的基本定律来保证安全通信,因此安全性是量子密码研究的重点。许多安全性分析是基于理想化的量子密钥分配系统,而实际QKD系统有很多
“大型客运站决策支持系统”是铁道部重点课题“大型客运站运营管理及智能化服务技术深化研究”的子项目。在此背景下,依据北京南站的实际特点和需求,采用计算机动态仿真技术
随着计算机网络的广泛使用和网络技术的不断发展,网络控制理论越来越受到人们的重视。网络控制系统中信息的传输是通过网络进行的,而网络的带宽是有限的,所以,数据包在传输的
中医学具有悠久的历史,是我国独特的医学和临床诊疗方法。同时,中医也是一门临床医学,从临床中累积经验,形成理性认识并回归临床,是中医学术发展的基本模式。在长期临床过程形成的中药处方及其加减配伍规律是获得有效处方和诊疗技术的基础知识。因此,从长期积累的知识中找到共同的和真正有效的中药处方,有助于疾病的治疗和中医的发展。当有大量的临床数据即中药处方数据及加减配伍规律时,我们希望通过数据挖掘技术找出真正有
信息技术和存储能力的跨越式发展为人们提供了更多选择空间的同时,也带来了信息过载(information overload)等问题。为了帮助人们快速搜寻自己偏好的商品,推荐系统应运而生。
图像分割是计算机视觉领域的一个重点难点课题,本文利用一种新的融合纹理和几何特征的图像分割框架,将图像分割问题转化为分类问题加以解决。针对所处理对象的不同,本文进一
局部特征检测算法是计算机视觉、模式识别、人工智能的基础,是局部特征描述算法的前提。不同视点的任意场景根据提取算法得到的局部特征结构是计算机视觉应用领域的基础。