视觉词袋模型的改进及其在图像分类中的应用

来源 :兰州理工大学 | 被引量 : 3次 | 上传用户:zhaoyun1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类技术是计算机视觉领域中最重要和最具挑战性的研究课题之一,在图像检索,视频检索,医学应用等领域得到了广泛应用。近年来,众多学者对图像分类技术进行了深入的研究,视觉词袋(Bag-Of-Visual words,BOV)模型则是其中最成功、应用最广的一种图像分类模型。然而传统视觉词袋模型下的图像分类技术还有一些不足之处,本文将从以下几个方面对其改进:1.针对传统视觉词袋模型中视觉词典的规模过大与判别力差的问题,提出了一种加权最大相关最小相似(Weighted-Maximal Relevance-Minimal-Semantic similarity,W-MR-MS)视觉词典优化准则。首先提取图像的尺度不变特征转换(SIFT)特征,并用K-Means算法对特征聚类生成原始视觉词典;然后计算视觉词典中视觉单词与图像类别的相关性和视觉单词间的语义相似性,并引入一个加权系数综合两者对图像分类的重要程度;最后通过删除视觉词典中与图像类别相关性弱,且视觉单词间语义相似性大的视觉单词,从而达到优化视觉词典的目的。实验结果表明,采用优化后的视觉词典对图像进行分类提高了图像的分类性能。2.针对视觉词袋模型中图像局部特征空间分布信息的缺失与图像分类的语义性差的问题,提出一种基于概率潜在语义分析(PLSA)与视觉短语的图像分类方法。首先用W-MR-MS准则对视觉词典进行优化,并在优化视觉词典的基础上建立视觉短语,进而增加图像局部特征的空间分布信息;然后结合该视觉短语与优化视觉词典中的视觉单词,构建一个新的语义视觉词典;最后基于该语义视觉词典,采用PLSA对图像建立模型,挖掘出图像中更具语义性的潜在主题。实验结果表明,结合了视觉短语与PLSA模型的方法提高了图像的分类性能。
其他文献
随着无线通信技术的发展,无线服务已向需要较宽频谱及较高速率的服务转移,但无线频谱资源匮乏已成为实现这种服务的障碍,因此认知无线电技术被提出。该技术突破传统网络中的频谱
医学影像配准技术是将多模态或单模态医学影像中包含相同解剖结构信息的像素点进行空间几何形变,从而建立浮动影像和参考影像在空间位置信息上的对应关系,使不同影像中包含相同
运动目标的检测与跟踪一直是计算机视觉领域的重要研究课题,众多研究者对此进行了深入的研究,取得了丰富的理论与技术研究成果。同时,随着其广泛应用于军事、民用的各个领域,人们
长期演进(Long Term Evolution, LTE)系统以MIMO、OFDM技术为核心,从而在传输带宽和发送功率保持不变的条件下,有效地实现数据的并行发送与接收,这一方面使得系统的频谱利用率得
本文介绍了过套管电阻率测井数据采集系统的设计方案及实现。通过了解过套管电阻率测井技术的国内外研究发展现状以及研究成果,详细介绍了过套管电阻率测井的一般原理,推导出俄
飞行器以极高速度再入大气层的过程中,会与空气发生剧烈摩擦,激发飞行器周围的空气离解和电离,形成等离子鞘套。等离子体鞘套会对电磁波产生吸收、反射和散射,使得通信信号产生衰
通信信号的参数估计和调制识别是非合作通信系统中一项关键的技术,在电子侦察、无线电频谱监测、紧急救援、物联网工程等领域应用中有着重要的作用。调制识别是指在不知道调
随着高速铁路的迅猛发展,在高速铁路上提供高数据速率和高质量的通信以缓解人们日益迫切的需求,给高速铁路通信系统带来了巨大的挑战。高速铁路中复杂多变的环境给通信技术带
随着集成电路工艺的飞速发展以及多核处理器性能的不断提升,芯片及系统间的互连通信对传输带宽的需求日益增长。传统的并行数据传输由于管脚数量以及时钟偏斜等限制,逐渐被以串
随着无线移动通信的发展,频谱利用率,高速无线应用与室内用户的体验对无线通信技术提出了越来越高的要求。第四代移动通信所采用的正交频分复用技术能够降低频率选择性衰落,并提