论文部分内容阅读
计算机软硬件处理能力一日千里,机器视觉已广泛应用于目标识别、工业检测、虚拟现实、飞行器导航和航空航天等领域。图像匹配和检索方法是计算机视觉领域的重要研究分支,是图像拼接、运动分析、对象跟踪、可视导航等研究方向的基础。近些年来智能设备、传感器、物联网等嵌入式平台得到了快速发展,智能设备大量获取图像,催生了对海量图像检索分析的需求,从海量图像数据中快速检索和匹配到需要的目标是当前研究的热点。本文以嵌入式平台图像检索为研究对象,对经典图像检索算法进行归纳总结,考虑到嵌入式平台处理能力相对较弱、存储空间有限的特点,提出一种基于图像局部二进制特征图像检索算法。本文首先阐明图像局部特征的定义、属性及特点,论述了采用局部特征的原因。局部特征提取第一步需要对图像进行预处理,本文首先研究和讨论了线性滤波、尺度空间等图像预处理相关技术。接着,本文综合分析和比较了经典的特征提取算法在环境噪声影响下的鲁棒性以及算法耗时情况。在众多特征提取算法中SIFT(Scale-invariant Feature Transform)算法最为出色,它对于环境变化有很好的适应能力,但需占用大量计算和存储资源。本文算法对SIFT金字塔生成过程进行优化,依据中心极限定理理论,使用均值滤波来代替高斯卷积,使用图像积分提升计算速度。本文算法在继承SIFT算法特征提取效果的同时降低了算法耗时。图像采集设备获取的原始图像一般需要占用较大存储空间,通常的做法是对图像进行压缩保存,但是图像压缩会造成特征的损失,因此对于压缩图像特征提取更具有实际意义。众多图像压缩算法中应用最广泛的是JPEG(Joint Photographic Experts Group)算法,本文从图像压缩特征保持入手对JPEG压缩环节进行优化。将信息论中的率失真理论引入图像特征保持算法,构造图像特征失真与码率的优化模型,根据多尺度中的特征分布特性将图像进行分组优化,实现在特定码率下最大程度保持特征信息。在描述符生成环节,首先比较分析几种经典的特征描述符优缺点,在此基础上确定特征描述符生成方法。本文使用对数极坐标构造SIFT特征区块,并将高斯权重与距离权重相结合,增强算法在图像模糊场景下的鲁棒性;考虑到SIFT描述符在进行海量图像数据匹配时会占用大量存储空间和计算资源,本文使用基于机器学习的模拟退火算法对生成的描述符中重复冗余的特征进行筛选剔除,为下一阶段的特征检索做准备。在检索算法方面,二进制描述符与SIFT描述符相比具有处理速度快、节省空间的优点,因此将SIFT特征简化为二进制串可以大幅提升处理速度。本文使用一种基于学习的稀疏哈希二进制描述符,将SIFT浮点型描述符映射为二进制描述符,使用异或运算来计算二进制特征的汉明距离,可以大大提高匹配速度,同时保持SIFT特征在原欧氏空间的距离相关性。在特征匹配搜索环节,本文研究了目前经典的搜索查找算法,传统的树形查找算法在高维查找时会遇到维度灾难,性能急剧下降。LSH(Local Sensitive Hash)是一种位置敏感哈希,原始特征向量经过哈希之后仍然可以保持其在原空间的相似性。本文使用基于Multi-probe LSH的查找框架,使用步进式探测,逐级探测哈希桶,大大提高了早期查找命中概率,这样只需使用少量的哈希表即可满足查询准确率要求。最后将本文算法与经典图像检索BOW(Bag Of Word)框架进行对比分析,实验结果表明本文的算法通过各个环节的优化更适合计算资源较少的嵌入式平台。