论文部分内容阅读
图像是人们认识世界最直观的载体,近年来随着多媒体数码技术的飞速发展和Internet的迅速普及,海量的图像数据涌入计算机网络,并且以几何级数快速增长。然而如此海量的图像数据并没有转化为信息和知识,人们对图像资源的利用可以说微乎其微。究其原因,人们很难快速准确地在海量的图像数据中找到自己需要的信息,也就是所谓的图像检索技术的不成熟。从上个世纪70年代就开始有图像检索技术的研究,主要是基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR)。TBIR对图像初期的人工标注要求很高,有其很大的局限性,特别是近年来图像来源的丰富和不确定性,极其庞大的图像数量使规范的人工标注不可实现。90年代以后出现了基于内容的图像检索技术(Content-based Image Retrieval,简称CBIR),在低层次上已经实现了颜色和纹理直方图、颜色矩和颜色集等多种图像特征值的检索技术,但人们对图像的理解和需求更多出于语义层次上,所以本文选择了基于图像语义自动标注的检索系统作为研究课题。针对现有的技术本文主要做了一下工作:第一,对图像检索的发展历程进行了总结,研究了图像挖掘和图像自动标注技术。第二,设计了一个基于分类机制的自动图像标注和图像检索的系统模型。第三,针对“词袋”模型的近重复检索的问题,提出了通过关联规则算法,发现频繁一起出现的视觉词组,从而消除视觉多义性和同义性,并对检索结果重新排序,返回更接近用户意图的检索结果。第四,提出了AS-BoW模型,优化自动图像标注检索的效果。