论文部分内容阅读
随着互联网中多媒体数据的快速增长,一个重大的挑战在于如何理解和挖掘图片与视频中的信息,其中又以多媒体数据检索的领域最受关注。一些典型的多媒体检索应用包括视频推荐、旅游向导、视频版权检测等等。所有多媒体检索系统的基础都是以图像的特征的提取和匹配为基础的,通过从图像中提取可以代表图像特性的特征信息,从而使检索图像成为了可能。图像特征信息主要包括全局特征和局部特征两种。全局特征主要通过某一种图像的特性来对图像进行描述,如图像的颜色、纹理等,其中全局特征受限于其较低的精度和健壮性难以适用于图像检索的应用场景。而局部特征算法关注的则是图像中各个局部的特征信息,如图像中物体的边和角等,对于图片颜色、放缩以及旋转的变换皆不敏感,具有更高的精度和健壮性。局部特征算法通常包含多种复杂的运算,同时为了更准确的描述图像,局部特征算法通常需要选取成百上千个特征点来代表一张图像,这些过程虽然保证了局部特征算法的准确性,但却导致局部特征算法的计算过程十分复杂,很难满足实时的要求。在一台配有3.3GHzCPU的服务器上,局部特征算法中效率最高的SURF算法也只能达到2.6帧每秒的处理速度,远低于24帧每秒的实时计算需求。同时,对于局部特征算法,通常使用高维向量表示一个特征点,而一张图片通常包含成百上千个特征点,从而导致一张图片的特征信息通常需要几百KB或者上M的存储空间。因此局部特征算法面临来自计算和存储两方面的挑战。为了克服图像局部特征算法面临的性能和存储的挑战,本文提出了一种由图像显著性区域指导的局部特征算法(以下简称为SRLF算法)。该算法的主要出发点是图像中的视觉关注的区域(显著性区域)通常是特征点比较密集的区域,而其他非显著区域中的点通常对最终结果影响不大。因此,如果只对显著区域中的特征信息进行计算和保存,则可以达到大大加快算法的处理速度并缓解存储上的压力。已有的显著区域算法虽然可以精确检测出显著区域,然而一方面需要对显著区域进行精确定位,需要引入复杂的计算过程,从而导致计算时间复杂,另一方面,由于很多特征点位于图像中物体的边界等位置,所以精确的显著区域标注会导致一些特征点的丢失,从而影响最终结果的精确性。SRLF算法利用了局部特征点在图像上的分布,通过计算其几何中心、离散程度等,可以高效的检测出近似的显著性区域。这些显著性区域将被用作过滤局部特征点的依据——所有落在区域外的局部特征点都将被剔除,因而待计算的特征点数量将大大减少。计算所需的近似显著性区域大致的步骤如下:1.依据图像中特征点的分布对图像进行划分,将图像划分为多个局部特征点集中的区域;2.计算每个图像划分中的特征点的几何中心,以及它们在水平方向和垂直方向上的离散程度;3.从计算出的中心点出发,逐步扩大每个显著性区域的面积,直到区域中所包括的特征点数达到一个阈值,并得到最终的显著性区域范围。实验数据显示,SRLF算法提取出的局部特征数量小于原算法的一半,并减少超过一半的存储空间。当将SRLF算法整合进一个实际的图像检索系统,整个系统可以获得超过2倍的加速。SRLF算法具有具有如下的特点:1.结合显著性区域算法,指导局部特征的过滤;2.算法简单高效,基于局部特征并复用其中间结果,没有显著的额外开销;3.近似算法,使用近似的显著性区域作为特征过滤的指导,但对于实际的图像检索系统的准确率无明显影响。