论文部分内容阅读
进入21世纪以来,随着移动互联网的快速发展,图像作为信息流动的重要载体,其获取与传播变得更加快速,因此如何实现图像的精准识别与高效处理成为当下人工智能领域亟需解决的问题。正如人类眼睛对实际图像的认知一样,对图像有了理解才使得对图像的识别成为可能。因此,在计算机视觉领域,如何对图像进行合理而充分地理解、描述和表示成为该领域众多学者当下的主要研究课题。其中,尺度空间作为有效的图像空间信息获取方式,与人类视网膜对真实事物的感知具有高度的一致性,因此尺度空间长期成为学者们对图像进行表示的重要媒介与手段。传统基于尺度空间的图像特征生成方法更多是对图像空间信息的描述,然而图像中还包括全局和局部等浅层视觉信息以及内容、情感等深层语义。另外,以往的尺度空间划分更多依靠专家经验,不利于算法进一步的应用与拓展。针对上述问题,本文将图像的浅层视觉信息引入尺度空间,采用自适应策略进行空间的尺度划分,最终对目标图像进行更加充分有效地表示。本文主要研究内容如下:(1)针对传统基于空间金字塔匹配模型的特征提取算法忽略了图像浅层视觉信息的问题,提出一种结合浅层全局和局部视觉信息的图像特征生成算法。首先,将原始图像划分为逐渐细粒化的子区域;其次,对于不同层次的子区域,基于灰度共生矩阵生成相应的纹理特征,并通过自适应查询后融合策略确定每一子区域的权重,进而得到目标图像最终的浅层纹理信息;最后,将得到的纹理特征融入SIFT特征,生成目标图像最终的特征表示。将得到的特征用于图像分类任务,并在数据集15-Scenes、Caltech101和Caltech256上进行实验,实验结果表明,相比其它相关的特征提取算法,结合空间信息与浅层纹理信息能够更加充分有效地对图像进行表示。(2)针对现有的尺度空间划分方式更多依赖专家经验,提出一种基于粒子群优化的自适应尺度空间划分算法。首先,采用粒子群优化算法对空间尺度的最大和最小放缩比例进行优化;其次,将累积稳定性评价方法融入粒子群优化框架,进而生成最终的特征表示;最后,通过将所得特征用于图像匹配任务,在Oxford和Fischer图像匹配数据集上进行对比实验,实验结果表明,通过自适应地找寻最优的空间尺度划分方案,能够实现对图像更加有效的描述和表达。(3)针对基于尺度空间的特征生成方法大多忽略对视角关注点的重视,另外现存的方法通常对不同的关注点赋予相同的重要度度量,提出一种基于多金字塔空间结构的图像特征生成算法。首先,将原始图像划分为逐渐细粒化的子区域,并将由探测算子探测到的特征点个数作为每一个子区域的重要度度量;其次,对每一个子区域进行高斯滤波来生成相应的尺度空间,并采用累积稳定性评价方法生成对应特征;最后,设计集群方式的算法并行化运算框架,降低算法的时间消耗。将所得特征用于图像匹配任务,在Oxford和Fischer图像匹配数据集上进行对比实验,综合实验表明,基于多金字塔空间结构的并行化图像特征生成方法能够更加快速有效地生成图像特征。