基于词袋模型的图像分类算法研究

来源 :北京交通大学 | 被引量 : 47次 | 上传用户：acxyvpfag

【摘要】

：

随着互联网的高速发展,数字图像大量地出现在人们的生活中,其数量和类别都发生了大规模地增长。图像分类能够帮助人们有效地组织和管理图像,这种技术得到了越来越多的重视。

【作者】

：

吴丽娜

【出处】

：

北京交通大学

【发表日期】

：

2013年01期

【关键词】

：

图像分类词袋模型视觉单词视觉短语迁移学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网的高速发展,数字图像大量地出现在人们的生活中,其数量和类别都发生了大规模地增长。图像分类能够帮助人们有效地组织和管理图像,这种技术得到了越来越多的重视。在各种图像分类方法中,词袋模型作为一种基于局部特征的图像分类方法取得了很好的分类性能,因此得到了广泛的研究和应用。词袋模型的一个重要的研究内容是如何创建和优化视觉词典(视觉单词集),以便更有效的表示图像并提高算法的分类性能。其另一个重要研究内容是如何利用迁移学习提高算法在新图像类别中的分类性能。词袋模型的迁移学习不仅能避免在每一类新图像中词袋模型都需要重新学习的问题,还能适用于仅有少量样本的图像分类任务。本文以创建适合迁移学习的视觉词典为目标,研究视觉词典优化和改进方法,提出用局部空间信息将多个视觉单词进行组合构成视觉短语。这种视觉短语能更有效地挖掘和表示不同图像之间的共同特征,消除视觉单词的“语义歧义性”,并能迁移到新类别图像的视觉词典中。本文的研究内容分为两大部分：第一,研究如何获得有效并有判别力的视觉单词和包含空间信息的视觉短语,为图像分类提供必要的信息(特征的表面信息和空间信息);第二,在新类别的图像学习中,尤其是仅有少量图像样本时,研究如何利用已学好的图像类别知识,通过迁移视觉短语加快新类别图像的学习并提高分类性能。围绕上述内容,本文的主要研究工作和创新性体现在以下三个方面：第一,提出一种加权的最小冗余最大相关(Weighted minimal-redundancy-maximal-relevance,WMR-MR)准则。WMR-MR准则从信息论的角度出发,根据视觉单词与图像类别之间、视觉单词与视觉单词的相关性,综合评估视觉词典在分类过程中的相关性和冗余性。通过删除视觉词典中与类别相关性弱且与词典内其他单词具有冗余性的单词,优化视觉词典,既保留了富有判别力的视觉单词,又缩减视觉词典的规模。利用该准则可以用相对小规模的视觉词典完成对图像集的描述,并保持算法的分类性能,解决了视觉词典规模过大带来的计算复杂性高、单词之间存在冗余的问题。而且这种小规模的视觉词典为创建视觉短语,以及视觉短语的迁移学习建立了基础。第二,提出一种创建包含局部空间信息的视觉短语的方法。在提取图像局部特征的同时获取局部特征的空间位置信息,并依据局部特征之间的稳定的邻近关系建立视觉短语,获得能够表示局部空间信息的视觉短语模型。与全局空间信息相比,本文的包含局部空间信息的视觉短语能够更灵活地处理图像类内的变化,有较强的鲁棒性。而且,视觉短语有助于消除独立使用其中任一单词可能带来的歧义性,增强对图像描述的可靠性。描述图像局部特征表而信息的视觉单词和描述图像局部空间信息的视觉短语,共同构成图像分类任务的两条线索。由于不同类别图像的空间结构性不同,该算法可以通过设定权值对两条线索进行权衡,使之能够适用于不同类别图像的分类任务中。第三,提出一种基于视觉短语的迁移学习算法。提出采用视觉短语来描述不同类别图像之间的共同特征,充分利用已有的知识帮助新类别图像的学习。实验证明,与直接迁移视觉单词相比,迁移视觉短语能更有效地提高词袋模型的分类效果。在新图像类的学习过程中,算法通过循环迭代的方式调整所迁移的视觉短语,保留对新图像分类有益的视觉短语,使得分类器在新图像类中也能获得良好的分类效果。与重新学习视觉词典的分类算法相比,这种迁移算法有效地利用了已有知识,在新类别图像的训练样本较少的情况下,也能获得较好的分类效果。

其他文献

政府政策调整下我国上市餐饮企业财务分析

从2012年底至2013年中央持续推出有关厉行节约反对浪费的相关政策法规，对公务人员公款浪费的行为进行了更加严厉的约束。餐饮行业作为以往公款消费的主要用途所在，在这次调整中

学位

餐饮业财务报表分析湘鄂情

第四种调解范式:电视与纠纷解决——基于“约请当事人”节目模式的分析与评价

传统上一般将调解分为司法调解、行政调解、人民调解。当今,大众传播作为立法、司法及行政权力外的第四种力量,越来越多的电视媒介以"约请当事人"节目模式介入纠纷解决,形成

期刊

电视新闻范式调解纠纷

河北省服务业对产业结构优化升级的推动作用研究

根据我国《服务业发展“十二五”规划》提出内容，加快发展服务业是我国适应经济快速发展的重要途径，是实现我国产业结构优化升级目标的重要准备。随着我国经济的飞速发展和社会

学位

现代服务业产业结构熵值法SSA

巨玫瑰葡萄叶片光合日变化及其与环境因子的相关性研究

葡萄叶片光合速率是葡萄的重要生理指标,为葡萄的适应性研究提供重要的参考依据。本研究利用Yaxin-1102便携式光合蒸腾仪,在葡萄果粒膨大期测定了巨玫瑰葡萄的叶片光合日变化

期刊

葡萄巨玫瑰光合日变化相关性

毛泽东三次挥毫赞许的人——记“飞将军”黄公略

黄公略，原名汉魂，字家杞，1898年出生在湖南省湘乡县一个普通的塾师家庭。1915年底，他投入湘军，开始自己的军旅生涯，曾担任过排长、连长等职务。1926年夏，随部编入国民革命第八军第一

期刊

黄公略红三军中国工农红军红一方面军毛泽东

早期康复护理在脑卒中偏瘫患者中的应用

目的探讨早期康复护理在脑卒中偏瘫患者中的临床护理效果。方法 86例脑卒中偏瘫患者随机分为对照组和观察组,各43例。对照组常规护理,观察组在对照组基础上给予早期康复护理,

期刊

脑卒中偏瘫早期康复护理Barthel指数量表

论不作为犯之先行行为

在不纯正不作为犯中，先行行为理论无疑是最具有争议的。本文首先介绍了先行行为与其他不纯正不作为犯保证人类型，并重点指出他们之间的区别，指出先行行为引起的作为义务的特殊性

学位

先行行为不纯正不作为犯范围标准

能源“新轴线”转向西半球

<正>辨风看向:中国石油经济技术研究院9月18日发布《国外石油科技发展报告(2013)》指出,随着油砂、盐下油和页岩油气资源成为能源"新宠",全球能源格局轴心已出现由中东向西半

期刊

石油储量世界第一加拿大

重庆市城镇化质量测度及其驱动因子分析

从城镇化质量的内涵出发,建立定量评价城镇化质量的指标体系,运用熵值法、贡献率和贡献弹性分析法,测算出1998年-2012年重庆市城镇化质量指数,并分析城镇化质量演变规律和驱

期刊

城镇化质量驱动因子新型城镇化重庆市

两大法系中的不方便法院原则及在中国的合理借鉴

一般认为不方便法院原则起源于苏格兰,并在英美法系国家得到了广泛的运用和发展。然而,大陆法系的主要国家和地区也存在着这一制度或类似的制度和做法,这些类似的制度或做法

期刊

不方便法院原则自由裁量权公平与正义法律移植

基于词袋模型的图像分类算法研究

与本文相关的学术论文