论文部分内容阅读
随着计算机和多媒体技术的高速发展,图像因为能简单和直观地概括、反映客观世界,逐渐成为社会生活中不可或缺的信息载体。属于图像分割领域的目标轮廓提取,或目标检测,目标边界定位、表示、提取方法虽然研究了几十年,但随着社会发展的需要,且图像分割问题与生俱来的“病态性”,它依然面临许许多多的问题。特别是目标轮廓提取(边界检测和表示)的有效实现问题,其中最为重要活动轮廓方法中的局部极值问题,关于算法初始化对结果的影响问题,目标轮廓提取的实现效率问题等都十分具有挑战性,有待研究更好的解决策略和方法。本论文正是针对传统轮廓提取方法,主要是著名的活动轮廓方法所存在的问题及缺陷,探讨目标轮廓提取模型的结构表示方法,以使得目标轮廓提取、边界检测和表示得以有效地实现。为解决这些问题,我们注意到轮廓提取目的就是把目标边界以适当的方式表示出来,即探求目标边界的具体坐标位置或者边界的曲线表示。按边界的表示方式分,有离散边界点表示法和连续曲线表示法。根据这一点,我们首先用到了神经网络强大的分类和曲线拟合性能,包括径向基神经网络和变种的自组织网络,利用它们实现了对目标轮廓提取模型结构的离散边界点表示法;其次,利用具有极强寻优能力的粒子群优化算法,建立活动轮廓模型,实现演化曲线各个部分能相互传递信息的轮廓提取模型的连续曲线表示;再次,我们提出一类圆弧样条族,并建立了相应的能量函数。通过优化能量函数,能同时实现目标轮廓结构的插值和拟合的连续曲线表示法。最后,我们建立了关于图像的在目标边界处带有旋转特性的向量场。把寻找目标轮廓结构的问题转化为动力系统理论的问题,并间接实现了轮廓提取模型结构的连续曲线表示。具体来说,本文主要做了以下工作:1.通过建立紧致径向基神经网络(compact RBF network)分类出图像区域中边界点。中心,宽度值,和权值是构建径向基神经网络三个很重要的因素。在确定上述三个因素的时候,我们提出利用三角不等式原理降低对训练样本聚类过程中的计算量;进一步利用图论的方法对聚类进行精化,其中提出了最大度生成树的策略来实现中心的精化;然后提出利用各向异性梯度下降的方法同时实现权重的学习和宽度值的精化。最后我们以此建立了一个关于训练样本的紧致径向基神经网络。我们把该神经网络应用到图像目标边界提取的实验中,得到很好的分类效果,能较好地实现非同质边界的定位。2.提出通过活动圆的方法来检测特征点作为建立径向基神经网络的训练样本。利用一系列圆心和半径变化的活动圆来获取图像目标边界的若干特征点,通过对这些特征点进行聚类,并建立相应的径向基神经网络。本方法利用图像像素的亮度和梯度模组成的向量作为神经网络的输入向量,实现了多目标,复杂背景,噪声和模糊边界的定位。3.建立了一个“类-SOM”的神经网络,实现了一种定位目标轮廓的由粗到精的启发式方法。由传统自组织映射(SOM)网络和万有引力原理启发,给出了一种“类-SOM”的由粗到精的目标边界定位方法。通过万有引力的方式定义出神经元演化的联合方向,及通过计算神经元参考梯度的方式来自适应调整神经元的演化速率。通过不断调整演化方向和演化速率,神经元能以恰当的方式演化到目标边界,并通过神经元和特征点的更新换代和多轮神经元的演化,把目标边界的信息逐渐传递给其它正在演化的神经元,实现了启发式的由粗到精的边界定位方式。该方法能较好地解决初始化,复杂凹度边界,非同质和弱边界的定位问题。4.针对活动轮廓的建模问题,如SOM-ACM等问题,本文提出了一种把活动轮廓上的点看成是一个改进型粒子群优化(PSO)算法当中的粒子的VBCPSO-ACM算法。其中,定义出粒子相应的向量丛,则粒子速度的更新被限制在该向量丛中,且与其它粒子的最佳位置也有关联。此外,通过对活动轮廓上的粒子的增删来调整活动轮廓对目标边界的逼近精度。该算法能避免如SOM-ACM等活动轮廓在演化过程中出现的自相交现象,保持活动轮廓的拓扑结构,且适用于非同质边界的提取。5.针对从图像边界获取的若干稀疏且无序的特征点,本文提出利用测地圆弧实现目标轮廓结构的插值和表示的方法。首先,给出了一种参数圆弧样条族的一般形式,并建立关于这些特征点的测地圆弧能量函数。其次,通过对这些能量函数的优化,确定其相应的有向弦切角和相邻点,得到一系列对稀疏无序特征点进行同时排序与插值的测地圆弧。实现了轮廓提取模型的结构表示。在优化非凸和非可微的能量函数时,提出了一种改进型的随机搜索方案,能很好地找到能量函数的全局最优点。该方法在目标轮廓表示中,能很好地防止弱边界的泄露,和长凹边界情况搜索曲线的早熟现象。此外,它具有较好的噪声鲁棒性且适用于多目标边界,开边界的提取和表示。6.针对传统活动轮廓提取模型中外力场依然存在的“平衡点”问题,使得活动轮廓的捕捉范围在某些情况依然有限,且对活动轮廓初始值较为敏感,我们把轮廓提取转化为一种新的向量场下极限环的定位问题。为此,本文通过对目标图像的切边界流场和垂直边界流场插值合成得到一个插值旋转和吸引流场(ISAF)。然后把利用动力系统中的理论,把目标闭边界与ISAF中的极限环对应。并定义好相应的Poincar′e截面,通过Newton-Raphson算法找出定义在Poincar′e截面上的Poincar′e映射的不动点及确定相应的周期,就可以把极限环的位置表示出来,也就得到了相应闭边界目标的边界表示方法。总的来说,针对现有图像目标轮廓提取模型中存在的问题和各种特殊情况,本文通过提出一揽子方案,建立了关于目标轮廓提取模型的结构表示方法,使得目标轮廓提取得以有效进行。