论文部分内容阅读
计算机视觉、图像理解相关的研究方向是让机器“看”到世界的科学,涉及到神经生物学、信号处理、图像处理、机器学习等众多方向,是人工智能研究中的重要领域。与其相关的技术成果能极大的改变人类的生产和生活,可广泛应用于大至航空航天、工(农)业生产、军事国防,小至日常家居、医疗卫生、交通导航等各个方面。形状是一种高级的视觉特征,是计算机视觉、图像理解等研究领域中最主要的研究内容之一。形状特征最重要的特点就是形状的可变形特性。为了解决形变大的形状匹配难的问题,本文主要从形状拓扑特性和形状的局部“子形状”两个层面入手,对可变形形状的点集对应关系、分类和相似性这几个方面进行了深入的研究,提出了全局拓扑信息的度量算法、灰度图像中计算形状轮廓长度的算法、基于子形状的形状分类以及基于子形状的形状相似度度量算法。本文的主要研究工作如下:1.提出了一种优先考虑整体拓扑性质的点集对应关系匹配算法。传统点集匹配中难以处理拓扑一致而变形较大的形状,针对这一问题,先把形状转化为图,然后提出了能有效度量两个形状全局拓扑相似性的“加权伪公共路径”的概念;在此基础上,分析了传统基于优化的点集匹配算法的能量函数,总结得出点集匹配中都显式或隐式的含有点集的空间变换和局部邻接两种信息的结论;并由此设计了一种平衡全局拓扑相似性和局部形状相似性且可用动态规划求解的能量函数,该能量函数不仅能找到可变形形状的点集对应关系,还能估计可变形状除去整体形变影响下的相似度。实验结果表明相比于经典的点集匹配算法,考虑整体拓扑性质的模型能在点集匹配过程中保持可变形形状的整体拓扑不变性,不会因为形状形变大而失效。2.提出了一种基于三次样条插值和像素灰度信息的形状轮廓长度估计算法。应用三次样条拟合灰度剪影图像中局部轮廓边缘,再通过泰勒级数近似估计样条函数的弧长;整个计算过程避免了计算拟合形状轮廓的样条曲线的具体参数,仅用到了估计位置周围4列、若干行的像素值,具有线性计算复杂度;理论的误差分析表明在不同分辨率,随着像素收敛量化阶的降低,相对误差上限成指数级降低。实验结果表明,该算法相对于经典算法,在经典人工数据集上的相对误差更低;在模拟实际数据集上具有和人工数据上同数量级的相对误差;而且相对于经典B样条的估计算法,该算法随着图像分辨率的提高,相对误差稳定降低。3.提出了一种基于子形状的形状分类算法。针对可变形状的分类问题,应用子形状方法描述可变形形状或形状类,能排除含有遮蔽形状的影响。提出了基于最优公共部分距离的子形状描述算法,该算法不仅能用于形状匹配,还可以结合其他图像点集特征识别或匹配图像;提出“频繁形状类”的定义,应用互信息的方法,给出度量子形状类表示形状类能力的“二类区分度”定义;并提出了一种基于子形状类的形状分类算法。该算法提高了经典数据集上的可变形形状的按类检索率。4.提出了一种基于子形状的形状相似度算法。针对子形状能充分体现可变形形状的局部形状不变性的特点,提出了基于轮廓的子形状相似性度量算法;针对局部形状的关节变形问题,提出了基于区域的子形状相似性度量算法;并提出了结合两种子形状度量的算法:分别在适用于轮廓、区域的度量算法的形状部分应用对应的度量算法,以减小形变对形状相似度的“影响。该算法可以明显提高在经典数据集上可变形形状的检索率。