基于多示例弱监督学习的物体检测和分类方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:roamer_wsj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物体检测与分类是计算机视觉领域的最重要的两个研究方向。现有大量研究成果中,良好的图片标记是获得较好性能的关键前提。然而,图片标记却是耗时、耗力的,能否从互联网中大量标记的图片中去建模识别并分类物体是一个较为困难的研究问题。本文从弱监督学习的思路出发,即基于弱标注图片(类标信息只提供到图片层次)进行多示例的建模学习。在多示例学习问题中,如何从复杂数据中发现有效的正例仍是较为挑战的难题。本文核心研究此问题,主要研究工作及成果概况如下。首先,我们提出了一个基于低秩和稀疏约束的子空间模型。由于同类物体的外观往往是相似的,因此物体的高维特征往往可以用低维子空间来表示。据此,我们提出一个子空间模型的学习方法来解决弱监督物体检测和分类问题。通过系数矩阵的低秩约束来对每一幅包含目标物体的图片进行优化求解一个标量矩阵。为提高准确率,我们通过引入?-insensitive loss和不相关因子,来增加子空间模型和显著负例之间的差距。并采用Block Coordinate Descent和Alternating Direction Method of Multipliers(ADMM)方法来优化。其次,我们提出了一个基于关键示例的物体分类模型(SMDIS)。SMDIS首先从正包选出真正的正例,然后结合Smooth Latent Support Vector Machine(SLSVM)进行训练,得出一个物体分类器。SLSVM已经在物体分类应用中获得较好的效果。用我们的子空间模型挑出具有代表性的正例,并结合SLSVM分类,能进一步提高模型的性能。在人脸数据集AR,UMIST和ORL和真实图像数据集Pascal 2007的实验中,获得了比传统的子空间模型更好的分类效果。在现实应用场景中,往往一张图片会包含多个正例。对此,我们通过学习多个子空间模型,采用基于Adaboost的策略把这些子空间模型组合在一起,形成集成学习分类器,通过学习一组权重把不同的分类器组合起来。该集成分类器能考虑各个子模型的优点,并重点关注难以区分类别的样本。在人脸数据集Yale B和AR上的实验结果表明,所提出的集成分类器具有较好的实验效果。
其他文献
煤矿巷道围岩松动圈的存在是一个普遍现象,随着煤矿开采深度的增加,巷道开挖后出现围岩松动圈不可避免。以研究全景数字钻孔摄像系统测量围岩松动圈厚度值为目的,结合Visual Bas
农村零售商业是中国社会主义市场体系的重要组成部分,是搞活农村经济,解决农村问题的关键。根据我国农村零售商业的现状,分析了其存在的主要问题,提出了要发展农村零售商业,必须实
本文以我国民族识别整体完成后的人口普查数据(1990、2000、2010年)为依据,以民族多样性和地理集中度指数为核心,讨论近二十年来云南省民族人口分布的空间格局及其演变趋势。
为研究叠加优化技术对高压涡轮转子装配的影响,通过叠加原理分析、高压涡轮转子装配数据统计,对比分析叠加优化方法装配与转台方法装配的高压涡轮转子的柱面跳动、端面跳动和
<正>协同治理理论是自然科学中的协同理论和社会科学中的治理理论交叉的理论,是在两种理论基础上发展起来的一门新兴学科。本文将协同治理理论引用到南京、镇江、扬州三市(以
图像分辨率通常表征了显示系统或图像对细节信息的表达能力。通常来说,图像的分辨率越高,所拥有的细节越丰富,从而图像的质量就越高。图像超分辨率重建算法是一种有效提升图像质量的算法,它能够增强图像的空间分辨率,增加图像的细节信息。基于深度学习的图像超分辨率算法的优点:首先,互联网上存在着大量的图像,足以满足深度学习所需的数据量;其次,网络模型可以直接学习得到重建后的超分辨率图片,计算简单直接;最后,基于
目的:探讨妊娠早期亚临床甲状腺功能减退症与妊娠结局及新生儿并发症的相关性。方法:2015年1月~2016年1月,妊娠早期亚临床甲状腺功能减退症60例,包括甲减病例20例,亚甲减病例