论文部分内容阅读
随着多媒体技术和计算机互联网技术的快速发展,图像数据正以惊人的速度增长。如何从海量图像信息中快速、准确地检索出有用信息,提高图像的管理和应用能力已经成为人们研究的热点问题。基于文本的图像检索技术通过对图像的关键词进行检索,难以满足海量图像数据库的检索需求;而基于语义的图像检索利用人的视觉感知检索图像,是图像检索技术发展的必然需求,然而“语义鸿沟”等问题一直制约其发展,难以实现按语义对图像进行精确检索;基于内容的图像检索技术,即CBIR是通过提取图像的视觉特征进行检索,成为视觉信息检索的主要方法。为了使检索图像和查询图像具有视觉一致性,研究者们对CBIR技术展开了深入研究,主要分为两类:一类是图像视觉特征研究,通过提取、选择和索引能充分表达图像信息的视觉特征;一类是引入用户的相关反馈技术,通过用户对检索图像的反馈,从而改善检索系统性能。本文围绕基于内容的图像检索技术的关键问题进行了一系列研究,其主要研究内容和创新点包括:(1)基于提升格式的图像视觉特征提取。结合提升格式在软硬件实现的优势以及小波在图像特征提取的多分辨特点,本文研究不同子带对图像视觉特征的影响,研究发现相对于传统2带小波而言,具有更多高频子带信息的3带提升格式能更精确的描述图像纹理信息,结合遗传算法提取图像特征,更加逼近人的视觉感受;(2)基于反馈验证的图像检索优化算法。虽然相关反馈技术能提高图像检索效果,但是用户参与程度高,不利于机器自动完成。本文通过分析检索过程中用户提交查询图像的模式,增加反馈验证过程,直接利用检索图像进行二次查询,优化检索算法,该过程无需机器训练或用户参与,非常适合计算机自动实现,满足智能化的需求。实验结果表明,本文提出的特征提取方法不仅可以大幅度提高图像检索性能,同时利于硬件实现;基于反馈验证的优化算法在无需用户参与的情况下,提高检索精度,对图像检索的智能化实现有着重大的意义。