显著性区域指导的局部特征算法

来源 :复旦大学 | 被引量 : 0次 | 上传用户:danielwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网中多媒体数据的快速增长,一个重大的挑战在于如何理解和挖掘图片与视频中的信息,其中又以多媒体数据检索的领域最受关注。一些典型的多媒体检索应用包括视频推荐、旅游向导、视频版权检测等等。所有多媒体检索系统的基础都是以图像的特征的提取和匹配为基础的,通过从图像中提取可以代表图像特性的特征信息,从而使检索图像成为了可能。图像特征信息主要包括全局特征和局部特征两种。全局特征主要通过某一种图像的特性来对图像进行描述,如图像的颜色、纹理等,其中全局特征受限于其较低的精度和健壮性难以适用于图像检索的应用场景。而局部特征算法关注的则是图像中各个局部的特征信息,如图像中物体的边和角等,对于图片颜色、放缩以及旋转的变换皆不敏感,具有更高的精度和健壮性。局部特征算法通常包含多种复杂的运算,同时为了更准确的描述图像,局部特征算法通常需要选取成百上千个特征点来代表一张图像,这些过程虽然保证了局部特征算法的准确性,但却导致局部特征算法的计算过程十分复杂,很难满足实时的要求。在一台配有3.3GHzCPU的服务器上,局部特征算法中效率最高的SURF算法也只能达到2.6帧每秒的处理速度,远低于24帧每秒的实时计算需求。同时,对于局部特征算法,通常使用高维向量表示一个特征点,而一张图片通常包含成百上千个特征点,从而导致一张图片的特征信息通常需要几百KB或者上M的存储空间。因此局部特征算法面临来自计算和存储两方面的挑战。为了克服图像局部特征算法面临的性能和存储的挑战,本文提出了一种由图像显著性区域指导的局部特征算法(以下简称为SRLF算法)。该算法的主要出发点是图像中的视觉关注的区域(显著性区域)通常是特征点比较密集的区域,而其他非显著区域中的点通常对最终结果影响不大。因此,如果只对显著区域中的特征信息进行计算和保存,则可以达到大大加快算法的处理速度并缓解存储上的压力。已有的显著区域算法虽然可以精确检测出显著区域,然而一方面需要对显著区域进行精确定位,需要引入复杂的计算过程,从而导致计算时间复杂,另一方面,由于很多特征点位于图像中物体的边界等位置,所以精确的显著区域标注会导致一些特征点的丢失,从而影响最终结果的精确性。SRLF算法利用了局部特征点在图像上的分布,通过计算其几何中心、离散程度等,可以高效的检测出近似的显著性区域。这些显著性区域将被用作过滤局部特征点的依据——所有落在区域外的局部特征点都将被剔除,因而待计算的特征点数量将大大减少。计算所需的近似显著性区域大致的步骤如下:1.依据图像中特征点的分布对图像进行划分,将图像划分为多个局部特征点集中的区域;2.计算每个图像划分中的特征点的几何中心,以及它们在水平方向和垂直方向上的离散程度;3.从计算出的中心点出发,逐步扩大每个显著性区域的面积,直到区域中所包括的特征点数达到一个阈值,并得到最终的显著性区域范围。实验数据显示,SRLF算法提取出的局部特征数量小于原算法的一半,并减少超过一半的存储空间。当将SRLF算法整合进一个实际的图像检索系统,整个系统可以获得超过2倍的加速。SRLF算法具有具有如下的特点:1.结合显著性区域算法,指导局部特征的过滤;2.算法简单高效,基于局部特征并复用其中间结果,没有显著的额外开销;3.近似算法,使用近似的显著性区域作为特征过滤的指导,但对于实际的图像检索系统的准确率无明显影响。
其他文献
以计算机、多媒体和Internet为标志的信息技术的发展正在对教育领域产生着越来越大的影响,计算机辅助教学(ComputerAssistedInstruction,简称CAI)系统有着非常广阔的应用前景。
本文所涉及课题为“反垃圾邮件系统研究与实现”,提出并深入研究全新反垃圾邮件过滤器系统和它的网络部署方案,对该课题的研究具有重要理论参考价值和实际应用价值。互联网70
印鉴识别是金融系统工作的一个重要内容,而印鉴纹理识别的识别技术一直是人们广泛关注的关键技术。本文通过对印鉴纹理识别技术、细节特征值等方面的理解提出了一种关于特征值
  本文在介绍移动通信网的知识和自动化测试及其工具的基本原理的基础上,详细阐述了面向通信软件的自动化测试平台的设计与具体实现。本文提出了自动化测试平台设计的基本原
  基于Web服务的价值链集成越来越受到人们的重视,基于业务流程的的集成在电子商务,企业应用集成等各个方面的应用更加广泛。这就要求能够在企业的业务流程层实现无缝集成。
随着计算机和通信技术的迅速发展,相对于目前计算机网络中广泛存在的客户机/服务器模式,另一种计算模式——点对点计算(P2P)逐渐流行起来。人们对该计算模式的关注,完全是由于该
数据挖掘是一门基于历史数据发现事物内在规律的应用科学,聚类是数据挖掘的一种重要手段。近年来,计算机和通信技术的快速发展带来了各个行业数据积累的快速增加,传统的基于静态
数据库中的知识发现(Knowledge Discovery in Databases,简称KDD)是数据库和人工智能领域研究的热点课题,其中关联规则挖掘是重要的分支。经典的和其它挖掘算法在时空性能方
多目标遗传算法(MOGA)擅长于求解高度复杂的非线性问题且通过一次运行可以搜索到一组Pareto平衡解。因此引起许多研究者的兴趣,提出了不少多目标遗传算法,并且得到了广泛的应用