论文部分内容阅读
随着计算机与互联网技术的快速发展,计算机图像在当今社会生活的各个领域发挥着越来越重要的作用。几乎每天都会产生海量的图像数据,面对如此庞大且纷繁复杂的图像数据,如何对其充分利用面临极大的挑战。图像检索是最基本的图像应用方式,但大部分的图像检索都是基于人工标注的方式来描述图像的整体场景信息,标注信息的准确性受主观因素影响较大,且标注内容的随意性较强,在面对数量庞大的图像数据时,人工标注方法已经显得力不从心,利用计算机进行自动图像标注的需求十分迫切。而场景识别正是实现图像自动标注的关键技术,因此近年来已成为了新的研究热点。与具有强结构特征的人工场景相比,自然场景呈现的特征类型与其场景内容和复杂度有关,因此自然场景识别并不能简单套用人工场景的识别方法。本文提出了一种图像场景复杂度评估模型,并把评估结果作为选择不同的场景识别方法的依据。在此基础上,针对简单的自然场景图像,研究了基于多特征融合和结果反馈的场景识别方法;而对于较为复杂的自然场景图像,研究了顾及空间关系的场景识别方法。本文的主要研究内容和成果包含以下几个部分:(1)图像场景复杂度评估模型本文选择信息熵、能量和熵、角点个数以及图像边缘信息等正相关特征参数建立图像场景复杂度评估模型,采用K-means聚类方法获取不同复杂度等级的特征聚类中心,根据图像与各等级复杂度聚类中心间的距离来评估图像场景的复杂度等级。(2)基于多特征融合和结果反馈的简单自然场景识别对于简单场景图像,研究基于多特征融合的场景识别方法。研究了包括颜色、纹理、形状的全局特征的提取和融合方法,在场景识别方法中引入反馈机制,进行权重自适应学习和调整,实现多特征权重的自动配置。(3)顾及空间关系的复杂自然场景识别对于复杂的场景图像,研究顾及空间关系的场景识别方法。该方法首先对图像场景进行子区域划分,提取各子区域的特征并进行特征聚类,形成各子区域的视觉关键字,进而构建整个训练图像集的空间视觉词典。进行场景识别时,采用SVM分类器衡量相应空间子区域间的相似度。综合所有空间子区域的相似度情况,最终获得该图像场景的识别结果。基于上述理论和方法,本文进行了相应的实验与分析,实验结果表明本文提出的顾及场景复杂度的场景识别方法,在简单自然场景以及复杂自然场景图像集上能兼顾识别精度和识别耗时,取得了较好的识别效果。实验结果验证了本文理论和方法的有效性。