论文部分内容阅读
目标识别是计算机视觉领域的一个十分重要的研究方向,是很多民用或军用领域的核心内容。近年来,在大数据背景下,以“深度学习”为主的目标识别方法取得了巨大的成功。相比于传统的计算机视觉的一些方法,深度学习能够更有效的利用大量的训练数据,得到更高层次的表达。然而,对数据的依赖所带来的隐患也是明显的。首先,深度学习过分依赖于监督信号,导致其对噪声和干扰较为敏感,极易导致模型过拟合。第二,深度学习的方法无法十分有效的表示多义性等不确定的问题。本文针对这两个问题,研究了更适合于较小样本的稳健目标识别方法。本文采用的基本模型是无穷受限玻尔兹曼机,它具有非监督学习的和自适应学习模型复杂度的能力,同时也具有更灵活可变的结构,因而更适于基于小样本的学习。首先,为了让无穷受限玻尔兹曼机具有监督和半监督学习能力,提出了判别式无穷受限玻尔兹曼机。该模型能同时对数据和标签的联合分布建模,同时能计算给定数据时标签的后验概率。然而由于所谓“顺序作用”的影响,模型训练收敛较为缓慢,并且容易产生较多冗余的隐藏单元。为了解决模型收敛缓慢的问题,本文提出了一种新的模型优化算法。该算法的核心思想是不再认为模型的隐藏单元的顺序是固定不变的,而是可以随机排列的。这种随机排列的建模方法可以大大消除隐藏单元之间的相互依赖性。进一步分析表明,新的训练算法可以使模型不再与隐藏单元的排列顺序有关。实验结果也验证了该算法具有更快的收敛速度,并且能最终达到更好的泛化性能。该算法也是本文研究所有模型的核心与基础学习算法。随后,在本文提出的训练算法的基础上,我们将判别式无穷受限玻尔兹曼机应用于多视角的雷达高分辨距离像目标识别。通过与传统的隐马尔科夫模型和普通的受限玻尔兹曼机模型的对比实验可以看到,本文提出的模型比隐马尔科夫模型具有更强的特征学习能力。同时又比受限玻尔兹曼机具有更好的自适应能力。利用玻尔兹曼机的生成式能力,本文还将模型应用于有部分视角缺失的多视角距离像目标识别问题上。模型根据观测到距离像,推断出没有被观测到的距离像,并且将补全后的距离像序列用于识别,大大降低了数据不完整带来的影响。为了使模型具有更强的表达能力,本文还提出了一种多层的无穷玻尔兹曼机模型,即所谓的无穷深玻尔兹曼机。无穷深玻尔兹曼机的每一层的隐藏单元的数量都是可变的,因而其自适应能力更强,能更有效的减轻人工模型选择的成本。同时,为了有效地处理连续值数据,我们提出了无穷高斯受限玻尔兹曼机,该模型可以利用隐藏单元自适应地学习每个像素点的均值和方差。通过将这两个模型结合,我们可以处理的数据类型的范围得以大大拓宽。实验结果表明,模型可以以更小的复杂度达到与经典深玻尔兹曼机相当的性能。为了能有效地学习高维的长序列数据,本文提出了无穷条件玻尔兹曼机,并且还提出了一种多尺度的结构以更好的表示序列中的长距离相关性。无穷条件玻尔兹曼机可以表示高维序列的条件分布,因而可以用于序列的预测和分类。同时,它也具有自适应学习模型大小的能力。我们将模型应用在距离像连续序列目标识别上,获得了较好的结果。我们还将模型应用于断续的距离像序列识别。模型能根据以往的距离像序列预测下一时刻距离像,得到完整的距离像连续序列并完成识别,从而大大提高识别的稳健性。最后,本文提出了两种将先验知识引入模型的方法。第一种是对模型的连接方式结构化,得到局部连接的无穷受限玻尔兹曼机。采用局部连接的方式可以使模型更有效的学习图像中存在的局部结构,模型在训练个过程中可以自动生成不同大小和位置的局部感受野。实验结果表明,引入合理的局部连接能提升模型的泛化能力,当训练样本较少时这一点尤为明显。第二种是受稀疏表示的启发提出了无穷受限玻尔兹曼机的稀疏激活约束条件,利用该约束条件控制模型的训练过程,可以使隐藏单元更具选择性。在不同数据集的实验结果也验证了该约束条件能有效引导模型达到更好的训练效果。