论文部分内容阅读
基于图的模式识别是计算机视觉和模式识别领域中一个重要的研究方向。在基于图的模式识别中,使用图来表示物体,图的顶点表示物体的各个组成部分,图的边表示物体各组成部分之间的关系。以这样的表达方式,图就可以捕捉到物体的关系与结构信息。此外,图拥有与生俱来的平移、旋转不变性。以上这些使得图成为特征向量表达之外的又一个重要的物体表达方式,基于图的模式识别因此在很多领域也获得了广泛的应用,例如形状分析、文档处理、生物医学图像处理、生物信息学、化学信息学等。虽然基于图的表达非常有效,然而当前大多数模式识别工具却不能直接以图为其处理对象,这一矛盾严重影响了基于图的方法的发展和应用。因此,研究人员提出了许多方法来解决此问题,可以分为两大类:一类是在图空间的方法,另一类是在向量空间的方法。前者主要关注如何直接以图作为处理对象来解决模式识别问题,这包括图匹配问题和定义图的相似度度量问题,例如图编辑距离。后者则是绕过图空间,将图转化到向量空间中,从而利用现有的模式识别工具来解决问题。这里的方法包括定义图的描述子、图嵌入和图核。图的描述子指的是定义图的特征向量的方法。图嵌入是寻找从图空间到向量空间的显式映射,将图转化到向量空间中。图核则是将核方法应用到图上,定义图空间到特征空间的隐式映射,解决图的模式识别问题。本文采取将结构模式识别和统计模式识别相结合的思路,既利用图的强有力的关系结构表达能力,又利用传统模式识别的丰富的数学工具,对基于图的模式识别在向量空间的方法做了深入分析研究,主要贡献如下:基于图的斑马鱼异常胚胎检测算法:斑马鱼的异常胚胎检测对于阿尔海默综合症的研究具有非常重要的意义。首先将斑马鱼从背景图像中分割出来。使用纹理特征训练得到的二类分类器作为分割算法。然后,提取斑马鱼的形状轮廓,将其用图来表示。如此一来,问题转化为一个图的分类问题。为此,提出图的向量化算法。采用对结构进行统计的思路,首先定义团直方图来表示图的顶点到其邻接顶点之间的分布,捕捉顶点层次上的统计信息。然后,使用基于码表的方法将图转化为特征向量,捕捉图层次上的统计信息。最后,训练分类器进行分类。在斑马鱼数据集上的实验结果表明了所提出的方法不仅有效,而且对于物体的形状变化和噪声都有很强的鲁棒性。属性图嵌入的结构化学习方法:要解决的是图嵌入问题,即寻找从图空间到向量空间的映射,使得利用此映射,可以将图的顶点嵌入到新的空间下。在那里,图的匹配、分类和检索问题得以完成。首先,引入图空间上算子的概念,从而可以将需要求解的映射看作是图的属性集上的算子。由于图的属性集与图的边空间相关联,因此,此映射是一个与图的拓扑结构相关的属性集上的线性算子。为了求解此映射,在Graphical Model框架下,从离散马尔可夫随机场的目标函数导出需要定义的目标函数,进而解一个优化问题。使用此嵌入,在一个具有1000个物体的数据集以及MPEG-7数据集上分别做了关系匹配、形状分类和检索的实验,并与同类方法相比较,验证了所提出方法的有效性。图属性嵌入的黎曼淹没学习方法:要解决的仍然是一个图嵌入问题,将关系结构嵌入到度量空间,从而可以在新的空间下做匹配和分类。从黎曼流形的角度来看,定义此嵌入为与样本类别标记相关的流形淹没的混合模型。混合模型的权重通过计算嵌入后图的顶点坐标的概率密度估计来得到。而淹没则需要通过使用迭代置信区域方法计算得到,其目标函数为图的顶点后验概率的硬极限与其估计值之间的L2范数。所提出的是一种通用方法,可以用来做匹配、分类和检索。在人工数据集、MNIST和MPEG-7分别做了图匹配、字符分类和形状分类的实验,验证了方法的有效性。