论文部分内容阅读
场景识别是计算机视觉领域重要的研究方向之一,室内移动机器人的场景识别要求机器人能够利用视觉信息对该环境或场景的类别作出判断,例如客厅、卧室、走廊等。本文针对基于多特征融合的场景识别技术所涉及的关键技术进行了研究,首先提取场景图像的全局和局部特征,然后利用多核学习的方法对两种特征进行融合并对场景进行分类。最后利用自行开发的软件进行了大量的场景识别的实验。本文完成的主要工作如下:第一,针对室内场景,采用了全局和局部特征相融合的特征提取方法。首先,建立了 H/I一维颜色模型,以便快速、准确地提取场景图像的全局颜色信息;然后设计了一种基于SURF描述子和Dense-SIFT描述子的SURF-DS-BoW局部特征分域提取方法,其中SURF能够描述场景中特征显著变化的前景区域,Dense-SIFT则有利于描述变化平缓的背景区域,在生成BoW特征时,将这两种特征加权融合,能够更准确地表达场景的图像特征。第二,在特征向量映射到视觉单词的过程中,采用自适应分层K-means的聚类算法,有效地提升聚类准确性,并减少了 BoW的表征时间;设计了一种改进的SWSA-BoW模型,用来提取场景图片的局部特征,该模型基于一种视觉单词加权方法,即近义词软分配(SWSA,Similar Word Soft Assignment)。近义词软分配法将提取到的特征分配给几个与其距离较近的视觉单词并赋予不同的权重,可以有效消除视觉单词间同义性和歧义性的影响,进一步提升视觉单词的区分能力,并克服传统软分配方法的不足,有效地提高场景识别的准确率。第三,利用多核学习的方法将全局和局部特征进行融合,提升支持向量机(SVM)分类器的性能。首先确定了每个特征对应SVM的最佳核函数,然后利用多核学习优化每个函数对应的权重。相比单核而言,基于多核学习的支持向量机能够获得更好的分类性能。最后,本文基于Microsoft Visual 2012和OpenCV开发软件,对家居场景进行实验,实验结果表明本文提出的方法能对场景进行高效的识别。