多类别图像分类的关键技术研究

来源 :合肥工业大学 | 被引量 : 1次 | 上传用户:cm__
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和移动终端技术的飞速发展,越来越多的用户愿意将自己拍摄到的图片上传到网上。然而,用户上传的图片通常是杂乱无章的。利用人工来整理这些图片,肯定可以达到很好的效果,但其代价是不可估计的。因此,如何有效地利用计算机视觉技术来对用户上传的图片进行分门别类,对学术界和工业界来说,都有着深远的意义。图像分类是典型的模式识别问题,根据其类别的多少,可分为两类图像分类和多类别图像分类。显然,多类别图像分类有着更广泛的应用场景和更大的实际价值。因而,现在一般说的图像分类都是指多类别图像分类。虽然现有的许多机器学习方法都能用来解决多类别分类问题,但它们很少考虑到多类别图像分类任务自身的诸多特性,比如类别数目可能很大,类别间区分度可能很小(细粒度图像分类),类别可能不互斥(多标签图像分类),某些目标类别可能没有训练样本(零样本图像分类)等。针对多类别图像分类问题的自身特性,本文展开了一系列相关关键技术的研究,具体研究内容和创新点如下:1)针对类别数目较大的情况,提出一种选择性的子空间学习方法。传统有监督的子空间学习方法虽然能在一定程度上解决特征维度高和样本数量少之间的矛盾,但是当类别数目过大时,效果通常会明显下降。为此,本文提出了一种选择性的子空间学习方法,通过挖掘样本和类别间的关系,为每个测试样本构造一个局部子空间,从而解决了传统子空间学习无法处理的类别过多的问题,提高图像分类的准确率。2)针对细粒度图像分类,提出一种基于主动标注集的深度学习方法。在细粒度图像集中,类别间的差距往往非常细微,一个类别很有可能跟另外几个类别非常.相近,这给学习模型带来了很大的困难。本文通过分析细粒度图像集中类别间的混淆关系,提出一种基于主动标注集的深度学习方法,以期在训练过程中拉开混淆类别间的距离,从而使得学习到的深度分类网络更加鲁棒。3)针对多标签图像分类,提出一种随机裁剪池化的深度学习框架。多标签图像中,背景和物体布局通常都比较复杂,这给分类器的学习带来了极大的困难。为此,本文提出一种随机裁剪池化的深度学习方法,来自动挖掘多标签图像中信息量大的区域,从而达到排除杂乱背景干扰,提高多标签图像分类准确率的目的。4)针对零样本图像分类,提出一种联合属性回归和类别原型修正的方法。零样本图像分类中,由于训练时无法获取测试类别中的任何图片,因而只能通过一些诸如属性等的中层信息来联结训练类别和测试类别。虽然常用的属性回归方法能在一定程度上建立这种联系,但容易引起投影域漂移问题和假中心问题。为此,本文提出了一种联合属性回归和类别原型修正的方法,有效地解决了属性回归方法遇到的挑战。
其他文献
目的:研究不同娩方式对妊娠晚期B族链球菌感染孕妇及新生儿的影响。方法:选取2018年4月-2019年10月本院收治的合并B族链球菌(group B streptococcus,GBS)感染的产妇92例为研
以4M50-27.3/18.5-260型氮氢气往复压缩机为研究对象,分析了作用在其曲柄连杆机构上的各作用力,从振动的角度对其受力进行分析与分类,可知往复惯性力、旋转惯性力及倾覆力矩
建立了一种同时测定茶叶中8种有效成分(儿茶素、表儿茶素、表没食子儿茶素、没食子儿茶素没食子酸酯、表儿茶素没食子酸酯、表没食子儿茶素没食子酸酯、茶氨酸、咖啡因)的超
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
随着城市建设发展,城市道路"白改黑"改建引来新的契机,在路面"白改黑"技术运用中,要综合考虑沥青罩面反射裂缝防治措施。