论文部分内容阅读
基于内容的图像检索一直是计算机视觉、图像分析以及模式识别等学科的一个热点研究问题。近些年来,随着该理论的日益成熟,这项技术开始在信息检索、人脸识别、商标和知识产权保护、医疗诊断等领域逐步展开应用,可见其具有很高的商业价值。然而随着信息时代数据量的飞速增长,如何能在海量图像数据中高效准确的进行检索,成为该领域一个亟待解决的难题。云计算框架Hadoop的分步式文件系统的存储以及计算模式给我们的课题研究带来了新思路。本课题中应用的云计算技术主要是指Hadoop的分布式文件系统以及Mad/Reduce编程模型,而基于内容的图像检索的应用场景主要指基于颜色的图像检索。
本文在对传统的基于图像内容的检索算法进行了研究之后,提出了一种对像素空间进行分组划分的像素空间切分算法,经过大量实验对比证明,使用这种算法进行图像检索的精确度、检索率等性能要优于传统的基于颜色直方图的面积算法和排序算法,说明了该方法的合理性和正确性。
在此基础上,结合我们对分布式云计算框架Hadoop的研究成果,提出了将Hadoop中的Map/Reduce编程模型应用到基于内容的图像检索中特征向量匹配阶段的新思路,将图像的特征向量文件存储于Hadoop分布式文件系统中,通过在不同数据规模的图像库中进行图像检索,得到的实验结果证实该方法可以大幅提高图像检索效率,适合于在海量图像数据中进行检索。并将以上研究成果使用Java语言开发出CBIR工具,可以实现基于颜色的图像检索,具有较好的实用价值。