论文部分内容阅读
移动互联网时代的到来,加快了信息的分享和流动,过于泛滥的信息引爆了信息灾难,多媒体资源也深受其害,现如今多媒体资源已经成为互联网信息传播最主要媒介之一,图像是多媒体资源传播最为简单、直观的一个载体,图像检索成为当下的一个研究热点。然而基于传统的内容的图像检索技术,面临的首要问题是特征向量提取难度大,其次就是采用顺序检索方式,检索效率非常低;基于高维向量索引技术,暴露出的则是维度灾难问题,索引的建立工作量巨大,且索引的更新频率快。这些诸多问题已不能满足当下快速检索图像的一个需求,需要迫切提出一种新的检索方法来解决以上问题。本文针对以上问题结合图像在时间序列上的概念,进一步对图像检索领域深入研究,主要工作内容如下:1.针对高维向量维度信息丢失问题,本文提出了一种对高维向量文本化表示的改进,在全文检索技术应用到高维向量检索过程之前,首先需要将高维向量转变为文本信息,最简捷的方式是将高维向量中每一个数字拼接成一个字符串的形式,但是这种转变方式存在一定的缺陷,将会导致高维向量维度信息丢失。本文在高维向量转变过程中做了一个改进,在当前的维度信息转变为单个词之前加上一个维度标识信息,维度标识信息则表示高维向量的维度信息,就可避免上述问题。2.本文最主要的工作是提出一种DTW图像时间序列相似性匹配算法模型,把时间序列从声音识别领域引入到图像检索领域,它结合图像时间序列的相似性在时间空间上特性和动态时间规整算法的特点。首先遍历待检索的图像,利用时间序列特性,提取出每张图像像素序列,将得到一个长度为定值的数字序列,且在每个数字序列中加入了一组值为256的RGB颜色模型,最终得到本文需要的数字序列,最后通过DTW算法计算不同数字序列间的相似度距离。通过试验结果可以看出,基于DTW图像时间序列相似性检索方法可以快速检索相似性图像,相对基于内容的图像检索技术,不要提取图像特征向量,相对高位向量索引技术不需要对每一个目标建立一个索引,是一种需要对数据集进行训练,而能够快速检索出那些具有相似度图像的结果集的方法。