论文部分内容阅读
基于内容的信息检索是新一代(第四代)人机交互中的重要环节,本文围绕基于内容的图像检索系统的构建,重点对图像底层特征提取,相关反馈技术以及高层语义分类和检索等方面进行了研究。颜色特征是图像检索中广泛使用的底层视觉特征。针对颜色特征提取受到光照条件变化影响这一问题,本文提出一种基于加权色彩直方图的快速图像检索方法-WeightedChromaticHistogram,应用光照不变性对角模型对图像进行颜色通道归一化,压缩形成的二维加权色彩直方图图像,提取特征。该算法对于克服光照条件变化的影响具有良好的效果。
本文提出一种基于跨尺度特征值跟踪和质心扩展策略的无监督、多分辨率的语义目标物体提取算法-SalientInformationbasedUMOE(UnsupervisedandMultiresolutionObjectExtraction),应用于狭义域图像的语义特征提取和语义级图像检索;算法在基于统计聚类的图像分析基础上,由质心扩展策略根据综合颜色特征和灰度特征的跨尺度特征值跟踪策略捕获到的局部突出信息定位语义目标物体,获取物体区域形状。针对光照变化、遮挡、视角变换和杂乱背景等自然场景下拍摄的狭义域图像的提取效果,显示了该算法的优越性。
相关反馈已经成为图像检索中的一种重要的交互式检索手段。针对该方法目前存在训练样本数过少和缺乏代表性等问题,本文提出一种基于直推式支持向量机和减量反馈学习策略的相关反馈算法-ActiveTSVM;算法综合使用已标记样本和未标记样本进行支持向量机的训练,并在选择最具信息样本供用户标记的基础上,通过“减量反馈”学习策略,在保持分类器所需样本信息量不变的前提下,减少用户标记图像的数量,有利于更快速、更准确地理解用户的查询意图,进一步提高相关反馈的性能。
图像语义分类和检索摆脱了面向底层视觉特征的传统检索方式,把图像检索提升到面向用户语义概念的高度,得到了广泛的研究和重视。针对目前语义分类精度较低的问题,本文提出一种多特征融合的贝叶斯语义分类算法——Multi-BayesianClassifiersfusion和基于粗糙集理论的语义分类算法——Roughsetbasedsemanticclassifier,分别应用于两个模式的高层场景分类问题和更广义的多个语义类别的分类问题。实验结果表明算法可提高图像语义分类的准确性,对图像数据库的组织和管理具有实用意义。
在上述研究基础上,在新一代(第四代)人机交互的网络化实验平台-多功能感知系统中,构建了基于语义分类的CBIR系统原型-ImageFinder。通过基于功能驱动的多Agent协调与协作机制,将ImageFinder作为应用服务Agent单元与多功能感知系统中,将各独立的功能模块有机地联系和融合在一起,为用户提供图像检索服务,并实现自然而和谐的、具有良好亲和力的多模态人机交互。