论文部分内容阅读
近年来,随着智能手机性能的提升和普及率的显著增长,手机用户逐渐对其功能方面提出了更多样化的要求。由于公共建筑规模的逐渐庞大,以及其中位置指示标识的局限性等原因,即时获取用户当前所处的位置等地图信息通常是比较困难的,从而在室内环境下基于位置的服务,即通过智能手机实现室内定位功能开始成为用户的热门需求。利用图像信息的视觉定位技术因其不需预先部署任何基础设施,以及智能手机拍摄视频或图像的操作简单等优点,逐渐成为室内定位领域的研究热点。为了从数据量较大的图像库中迅速找出与用户输入图像相匹配的图像,并作为实现快速视觉室内定位的基础,对图像库进行快速检索与匹配的方法十分关键。针对这一问题,本课题提出基于视觉词袋的图像特征提取与分类算法,实现了在视觉定位中快速获取数据库图像和位置信息的目的。首先,阐述了本课题研究的目的意义与相关领域及课题的国内外研究现状,包括视觉词袋模型、图像特征提取和监督分类算法的研究现状。其次,对较成熟的四种图像特征提取算法,SURF、BRISK、感知哈希算法和gist算法进行了研究并分别加以实现。课题研究中分析了四种算法在实际图像匹配性能方面的表现以及各自优劣势,选择了gist特征提取算法作为后续研究的基础。而后,针对单独使用全局特征描述子进行图像检索与匹配性能不佳的问题,提出了使用图像全局特征的视觉词袋构建方法。该方法基于改进的gist全局特征提取,使用K均值聚类算法对提取的特征进行分类构建视觉词,从而通过比较视觉词直方图,实现了图像快速检索与匹配,且该方法具有良好的性能。最后,针对在线阶段对图像检索与匹配速度以及准确性的要求,提出了基于视觉词袋的有监督图像分类算法。该算法在离线阶段通过有监督学习过程来得到图像分类器,在线阶段利用该分类器对用户的输入图像进行分类。对提出的基于视觉词袋的图像特征提取与分类算法在实际环境下进行分析的结果表明,该算法对于从定位环境下采集的图像库,可以很好地实现对用户输入图像的快速检索与匹配,提高了视觉定位过程的实时性。