论文部分内容阅读
随着多媒体数据(图像、视频和音频)的爆炸式增长,人们急需一种能够方便多媒体数据库管理和访问的技术,基于内容的多媒体检索(CBMR)应运而生。基于内容的图像检索(CBIR)是CBMR的一个重要分支,近期CBIR研究的一个重要方向是基于区域的图像检索(RBIR),本文的工作即从这个角度出发的。首先,本文分析了图像分割在RBIR中的优势和劣势后,提出了一种简化的图像区域模型(SIR)-前景和背景。本文先进行图像分类,将图像分类为对象图(ObjectImage)和背景图(Non-objectImage)两类;然后对分类为对象图的图像进行有效区域定位,最后对有效区域进行分割得到对象;而被分类为背景图的图像则不进行分割。检索时,如果查询图为对象图,则采用基于区域的检索方法,否则根据全局特征进行检索。本文方法通过图像分类和有效区域定位减小了图像分割范围和区域数量,从而减小了区域匹配算法的复杂度,因此能够提高检索速度。其次,本文将改进后的基于权重调整(Re-weighting)的相关反馈(RelevanceFeedback)引入到检索系统中,并且在借鉴文本检索中的查询扩展和优化方法后提出了查询传播算法(QPA),实现了语义扩展。实验表明,本文的相关反馈方法具有快速学习且不容易达到局部最优的特点。最后,结合本文提出的图像分割新策略和结合查询传播算法,本文设计并实现了自己的RBIR系统-ObFind。虽然系统在几个方面还需要进一步改善,但是从实验结果来看,本文的系统ObFind能够完成基本的图像检索功能,并且具有与SIMPLicity系统相当的平均检索准确率,具备了一定的实用性。