论文部分内容阅读
计算机视觉的基本目标之一是景物对象的识别,即判断两幅图像是否是同一景物对象的不同视图,对象识别面临的主要困难是同一景物对象的不同视图的观测值之间发生了改变,解决这个问题的基本方法之一是利用景物对象观测值的不变量。所谓对象观测值的不变量是指景物对象在经过内在的或外在的改变之后保持不变的量,这些不变量是景物对象观测值的某些函数。景物对象观测值的改变可能是对象自身的变化引起的,也可能是对象的观测环境的改变引起的,影响观测环境的主要因素是光照条件及观察位置和角度。观察位置和角度的改变使得同一对象的不同视图间发生了几何变化,但图像之间在数学上由一个几何变换相关联。本文主要研究景物对象的视图在几何变换下的不变量,所涉及到的几何变换主要是射影变换和三维至二维的投影变换,所涉及到的图像的测量特征分为纯粹几何度量以及几何度量结合灰度度量,进而将研究目标分为射影与置换不变量、投影不变量、以及射影矩不变量。射影不变量是射影几何中的经典结果,但经典射影不变量的构造依赖于点的排列顺序,不同的排列顺序一般产生不同的值,这给点模式匹配带来了麻烦。即是射影不变又是排列顺序不变的量称为射影与置换不变量,已有的构造射影与置换不变量的方法利用原始射影不变量的某个高次对称函数,计算量较大、稳定性较差。本文给出了两种构造射影与置换不变量的新方法,其一是基于最大值函数,所产生的射影与置换不变量是某个原始的射影不变量,实验结果表明该构造比以前的构造计算量较低、稳定性较好,其二是基于某平面离散点集的包含度,这是一个整数射影与排列不变量,并用实验验证了其射影不变性。在三维至二维投影变换的研究中,本文做了四项工作:一是给出了非线性多元多项式方程组的一种特殊求解方法,可用于满足秩2约束的基本矩阵的估算中,该方法基于拉格朗日乘子法,将高次多元方程组求解问题化为一元方程求解问题,降低了时间复杂性、提高了解的精确度;二是构造了空间中六个点与其投影点间的几何不变关系,这种不变关系可用于基于模型的3D景物对象识别中;三是根据这个几何不变关系,推导出了三维空间受限几何结构中的六个点的投影不变量,实验结果表明该不变量具有很好的表示能力,可直接应用于受限结构的识别应用中;四是给出了一种由两幅未标定图像构造三维离散点集的射影不变量的新方法。射影不变矩是本文的研究重点,因为计算机视觉的基本几何模型是射影几何,因而获得射影不变性是最直接的目标,然而,已经被证明,不存在一般情况下的射影矩不变量,Suk与Flusser曾试图用无穷级数展开的方法获得近似的射影不变矩,但后来发现,他们的构造是错误的。既然不存在一般情况下的射影不变矩,只能迂回地解决这个问题,也就是:对射影变换作限制;扩展矩的定义;构造近似不变量;增加已知条件。本文依上述思路主要做了三项工作:一是证明了一类扩展矩的函数在某类受限射影变换下是不变的;二是证明了另一类扩展矩的函数在某类更普遍的受限射影变换下是近似不变的;三是给出了一种基于两个参考点的扩展矩一般射影不变量,并用实验结果支持了数学推导。这些不变量具有较高的分辨能力,且具有一定的抗干扰能力,本文给出了这些不变量在膨胀、腐蚀、模糊、遮掩操作下的实验结果。