论文部分内容阅读
本文从形状建模角度出发,研究在形状空间上使用语法模型,对通用物体分类识别的能力。其中采用了基于与或图的随机图像语法模型,以此指导对形状物体的理解、分解、学习、采样。针对形状的匹配计算,本文提出一种分层的图形匹配算法,通过在子图分割与匹配的同时迭代采样,来兼顾匹配速度与准确性,并具有较好的抗背景干扰能力。可用于自顶向下的物体识别匹配验证。针对物体局部的结构性信息,显式定义了图形基元结构,提出了图形基元的检测模型与算法,根据稀疏编码原理,学习出14种单一基元与20种复合基元作为编码字典,用于自底向上的判别式分类。基于与或图模型,本文提出了一个同时结合自底向上与自顶向下两个计算方向的级联式判别分类计算框架。首先,通过学习与或图,针对各物体类别的形状模板,在SCFG/MRF约束下进行重采样,获得手工收集的数据中不曾出现的具有新外形的产生式样本,从而更均匀、更好地反映本类物体流形;其次,利用产生式模板构成的训练集,学习出各类物体在34种图形基元构成的编码字典上的分布;第三,以图形基元的分布为基础,级联多步自底向上判别式分类方法,每一步保持较低的弃真率的同时,尽量把错误的候选集排除掉,实现对大量候选集的快速筛选;最后,对剩余的少量候选集采用图匹配计算验证,获取最终识别结果。实验表明,这种方式能够在识别的速度与准确性上同时取得好的效果本文最后介绍了基于与或图模型与相应数据集构建的、能够存储、表达复杂视觉知识模型的数据库,第一次在图像数据库中完整表达了基于内容理解的高层语义信息,这是也在现有的大型开放性数据集中从未实现的。