基于词袋模型的图像分类方法研究

来源 :兰州理工大学 | 被引量 : 6次 | 上传用户:finney_young
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类是计算机视觉中一个比较经典而重要的课题,可用于图像及视频检索、数字化图书馆的管理和医学图像处理等领域。“视觉词袋”特征是常用的图像特征表示方法,近年来,受到研究人员的广泛关注。该模型首先提取局部特征并描述;然后,对图像特征描述子聚类处理,构建视觉词典;最后,统计整幅图像中出现的视觉词汇及其频率。本文从以下两个方面来研究视觉词袋模型:一、背景信息会干扰图像的分类性能,利用图像分割去除背景信息提取目标区域,对目标区域构建视觉词袋模型;二、已知训练集的类别信息在图像分类中是非常关键的信息,提出了一种利用已知训练集类别信息来构建视觉词袋模型的图像分类方法。主要具体工作如下:1、针对背景信息干扰图像的分类性能,本文尝试通过图像分割去除背景信息提取目标区域,提出了提取目标区域词袋特征的图像分类方法。首先,利用图像分割去除背景信息提取目标区域;其次,对目标区域构建视觉词袋模型;最后,使用支持向量机(SVM分类器)对图像进行分类。PASCAL VOC2006及PASCAL VOC 2010数据集上的实验结果表明,提取目标区域词袋特征的图像分类方法具有较好的分类性能。2、针对现有的图像分类工作没有考虑到利用已知训练集的类别信息进行优化视觉词典,提出了基于TF-CDF(Term Frequency-Document Frequency in Categor y)词袋模型的图像分类方法。首先,对图像提取SIFT(Sca le-Invar ia nt Feature Tra ns for m)特征并对SIFT特征聚类处理,生成视觉词典;然后,引入TF-C DF算法对每幅图像进行特征筛选,利用筛选出的词汇来描述图像信息;最后,使用s LDA(softmax Latent Dirichlet Allocation)模型进行图像分类。LabelMe和UIUC-Sport数据集上的实验结果表明,基于TF-CDF词袋模型的图像分类方法具有较好的分类性能。本文提出了两个基于词袋模型的分类方法,分别是提取目标区域词袋特征的图像分类方法和基于TF-CDF词袋模型的图像分类方法。四个真实数据集上的实验结果表明,本文的方法与现有方法相比,本文方法分类准确率高于传统的视觉词袋模型并具有可行性。
其他文献
目的解决胃得安粉末在沸腾制粒中存在的颗粒疏松、质轻、堆密度小及其引起片重不足问题,优选胃得安粉末在沸腾制粒中的最佳工艺条件。方法选择粘合剂组成、制粒温度、喷枪工
介绍了热固性塑料造粒新技术——喷雾造粒的特点、工艺,对喷雾造粒产品与筛选造粒、挤出造粒产品的颗粒、性能进行了对比。
电子图书是近年来最受关注的图书形式,随着此类图书产品的丰富和市场的日益发展,在2011年的美国,电子图书已经占到市场的10%份额以上。同时,电子图书的定价方式也成为了业界关注的
以中煤平朔井工一矿4#煤层14112主运巷大坡度底板铺设混凝土路面为例,通过借鉴建筑上通用的混凝土泵车和煤矿刮板运输机的技术及经验,自制了混凝土溜槽,利用混凝土"自流"的性
一、概述强夯法是将几十吨重(一般为8~30吨)的重锤,从几十米高(一般为6~30米)的高处自由落下,对土进行强力夯实,以提高其承载力,降低其压缩性的一种地基加固方法。这是在重锤
<正>要实现"加快发展升级、打造幸福余江"的奋斗目标,队伍是基础,人才是关键。为此,我们牢固树立人才是第一资源的理念,着力集聚吸引人才、激活用好人才、尊重服务人才,大力
文章对TFDS系统中的铁路货车故障图像自动识别的方法进行讨论。经故障图像定义、图像提取、图像区域的划分、目标区域的提取和特征比较等流程后,自动识别出故障图像,减少利用
呼吸道合胞病毒(RSV,Respiratory syncytial virus)是最常见的导致婴幼儿急性呼吸道感染的病原体,同时还被公认为是某些高风险成年人(诸如老年人、患有慢性疾病的成年个体以及免
近十年来,纺织材料图像处理取得了长足的进展。对混色纱工业图像处理的过去、现状和未来进行了调研,分析了传统人工视觉和计算机视觉用于纱线检测的方法及其优缺点。接着,探
研究表明,浮选前先磁选能有效控制游离铁离子进入浮选体系;磁选精矿经反浮脱硅和正浮选可获得合格菱镁矿精矿。FSN可改变菱镁矿、白云石的Zeta电位并使两者之间可浮性差异明显提高。菱