论文部分内容阅读
静态图像中的目标检测技术能够根据视觉特征对图像中包含的目标进行检测定位和内容识别,并能获取目标的一些具体状态参数。该技术在图像检索、人机交互、场景监控以及机器人视觉等领域都有广泛应用。本文从机器学习的视角入手,针对多任务的目标检测和识别模型学习中知识共享以及知识迁移等问题进行了改进。 论文的主要工作包括: 1)实现了一个基于运动信息和局部并发特征的目标检测和识别系统。对于一些工作于小型终端设备以及机器人等应用场合下的图像目标检测识别系统而言,如何对周围物体进行透明在线的学习是一个关键问题。本文通过利用连续帧上的运动信息来提高机器学习的自主性,弱化学习过程,使系统可以通过与非专业用户进行简单的互动来发现和记忆目标。系统采用视觉单词包方法,同时利用了传统的局部特征描述子和局部并发特征来描述目标,在一个由十数种常见目标组成的数据库上取得了良好的效果。 2)给出了一种基于隐式亚类共享特征的自适应目标检测方法。对于泛性的图像目标检测与识别问题而言,近年来研究者们倾向于通过增加模型复杂程度来学习那些由于视角及光照等因素表观变化更加剧烈的目标。此类方法往往在获得高性能的同时伴随着较大的计算量,如果目标问题本身的复杂程度并不高,直接使用此类模型往往会导致计算资源的浪费并带来过学习的风险。本文中我们从特征共享的角度来重新理解模型学习过程,提出一种针对目标本身的类内方差不同,自适应地在不同层次上对目标特征进行共享的模型学习方法。实验证明,通过这种自适应知识共享建立的级联式分类器在多种目标检测任务上实现了对性能和效率的自适应调整。 3)给出了一种结构化的选择性迁移学习算法。迁移学习方法是一种可行性很强的降低训练代价的方法,论文从多任务学习的角度考虑迁移学习问题,提出了一种可以从多个相关任务中自动提取有用信息,以对当前任务学习进行辅助的选择性迁移学习方法。该方法将迁移学习视为一种有偏的多任务学习过程,对每一个任务设置一个偏置权重来控制其对学习的影响。同时,我们通过在迭代学习的过程中添加约束使和目的任务最相关的部分源任务参加到知识迁移当中,保证了最有效的知识迁移。实验证明,该方法可以从混合了相关任务与无关任务的混合辅助任务集中有效地选择出相关知识并实现迁移。 4)实现了一种基于迁移学习的目标视角识别方法。如何处理多视角表观变化问题一直以来是目标检测与识别研究中的一个难点,直接通过手工标注训练样本来学习模型往往会导致过高的学习代价,而迁移学习正是解决这一问题的一个新手段。本文中我们通过选择性迁移方法,将一个混合数据集中的视角信息迁移到目标任务上学习目标视角识别模型,使得那些视角信息缺乏的目标可以借用相似目标训练样本上的视角信息进行学习。本文在多个目标视角识别任务上进行的实验表明,迁移学习方法大幅降低了模型的训练代价,提高了识别准确率,为通用目标检测与识别模型的学习提供了一条新思路。