论文部分内容阅读
【摘 要】对基于分子滤波的声图像分析进行了深入分析,同样对分析的办法及目的进行了探讨。
【关键词】分子滤波 声图像 分析
运动标点的检测与分析是视觉应用范围的一个重要的问题,对于视声觉范围而言,最后的目的也是要完成对水下标点的分析和确定。参考分子滤波的发展形势和分子滤波分析法容易完毕和强鲁棒性等优点,所以本文只对基于分子滤波的分析算法进行了研讨。
运动标点分析的目的即是找到同一标点在不同帧中的位置。传统的标点跟踪办法只有:模型一致法、流光法、加尔门和扩展加尔门等办法,模型一致法也即是通过要检测的标点的模型与图象中全部的未知物体进行比较。如果某一未知物体与该模型一致,则该物体即被检测出来,认为是与模型相同的物体,这是一种简单的标点分析办法,它完毕起来也比较容易,但一致历程的搜索空间会随着图象大小和模型大小的增大而急剧增加,若非有专门的硬件支持,否则这种办法会非常浪费时间,大大降低标点分析的效率;流光法是分析标点运动的常用办法,但在强杂波和强噪声图象背景下,流光分析办法是不稳妥的:加尔门滤波是有效的线性最优推测科技,但不能处理非线性和非高思状况。
人们为此曾提出了Kaman Etended Filtter状况推测科技,但其状况推测的有效性仍然严重依赖范围模型的精确性,而建立精确的范围模型是非常困难的。近年来为了更好的处理非线性非高思情况下的运动范围状况推测问题,人们提出了分子滤(Particle Filter),分子滤波又叫Bayesian Bootstrap Filter或Monte Carlo Filter是以Monte Carlo随机模拟理论为根基,通过范围状况后验分布用一组加权随机模拟理论为根基,新的状况分布利用这些随机抽样Bayesian迭代进化产生。当今分子滤波已成为视觉分析,机械学习和机械人确定等领域的一研讨热点。
一、分子滤波的声图像分析
拜页思滤波与分子滤波器无论是在航天航空还是在自动化,通讯等各个领域,都广泛存在“推测”的问题。所谓“推测”,即是从带有随机误差的观察数据中推测出某些参考数值或某些状况变量。对于图象分析来说,利用对标点的观察(即获取每帧图象),可以对标点每一时间的运动状况进行推测。这时标点的运动状况可以包括标点的位置,姿态,大小等等。推测问题基本分为三类:从当前和过去的观察值来推测讯号的当前值,称为滤波;从过去的观察值来推测讯号的现在值或通过来值,称为预测或外推;从过去的观察值来推测过去的讯号值,称为平滑或内插。对于图象分析来说,滤波的目的即是根据当前时间获得的图象和之前所获得的图象,对标点当前时间的运动状况进行推测。
运动空间模型是一个非常重要的统计分析工具,它用范围方程来描述状况随时间演变的历程,并用观察方程来描述与状况有关的噪声变量。拜页思滤波理论基于上述运动空间模型的递推结构,利用全部的已知讯息来建造范围状况变量的后验几率密度,利用范围模型预测状况的先验几率,再利用最新的观察值进行修正得到后验几率密度,这样它就包括了观察值和先验知识在内的全部可利用的讯息,推测误差较小。另外,拜页思滤波通过未知参考数值看作随机变量,得到的推测值是该变量的一个特定完毕,所以拜页思推测适合于处理非线性和非高思范围的状况推测问题。
蒙得加洛办法又称为随机抽选法或统计试验办法,其基本思路是把实际求解的问题描述成某种随机变量,然后从已知几率分布抽选,最后建立各种推测量。蒙得加洛办法特别适用于无法用数学工具进行精确描述的场合,分子滤波办法是蒙得加洛办法和拜页思办法的结合,是求解拜页思推测问题的一个实用算法。分子滤波的中心思想是用一组加权的随机抽样。当抽样数足够多时,可以近似于真实的后验几率分布。范围运动求解由拜页思迭代推理历程完毕,分子滤波算法不用满足范围为线性,噪声高思分布,后验几率也是高思型的限制条件,所以应用面更广。同样因为分子滤波具有拜页思滤波的时域递推构型,所以不用储存全部时间的历史数据,运算时也只需要上一时间的推测值和当前时间的观察值,对运算机的储存要求小,增加了运算速度。
本文中所探讨的均是基于识别的标点分析办法,综上所述,对标点的分析即是在声图象序列中寻找与标点相一致的部位,这个寻找的历程利用对标点状况进行推测来完毕。通过分子滤波这种实用的推测问题求答案办法引入声图象分析领域,建造出基于分子滤波的分析框图,并结合标点各个层次的特点,建造性能良好的分析器,实验证明分子滤波分析办法具有良好的鲁棒性。
二、分析的办法及目的
为简化分析问题,本文只考虑平移模型,需要求解标点的两个运动参考数值T=TX,TY,其中T,X和T,Y分别为水平方向和垂直方向的标点中心点的位置。这样一个分子点就表示标点的一种可能的运动状况,即具有一组可能的运动参考数值(T)。根据分子的运动参考数值,即可求出该分子所对应的标点模型的一种变形情况,利用运算这个变形模型与实际图象的相关值,对分子赋予与相关值成比例的权值,由分子加权来表示标点状况的后验几率。
标点的先验知识标点的先验知识包括图象模型和标点的初始运动参考数值。标点模型具有一定的先验特点,基本认为是区别其他标点的特点,例如标点的色度特点,轮廓,和分布色度等。用于描述标点的“模型”是标点某些特点量的集合,根据对先验知识的利用程度,我们通过其分为三类:第一类是利用图象部位区域象素点的色度构成的模型;第二类是以图象的底层特点构成的模型,以轮廓为代表;第三类是图象的高层特点构成的模型,基本具有语义性质,并一致人类的一些视觉特点,例如Gabbor小波特点等。本文选择用色度分布来描述标点,并利用比较标点抽样和参考标点的灰度分布,建立范围观察模型,同样标点的色度分布和描述的是一种比较适当的标点描述方法,它能减轻标点的部位遮盖,翻转和型变对分析算法的影响。这种办法的缺点是如果没有更新模型,分析的稳定性通过性下降,但本文通过声图象先处理成二值图象再分析,这种缺点不是非常显著。
【关键词】分子滤波 声图像 分析
运动标点的检测与分析是视觉应用范围的一个重要的问题,对于视声觉范围而言,最后的目的也是要完成对水下标点的分析和确定。参考分子滤波的发展形势和分子滤波分析法容易完毕和强鲁棒性等优点,所以本文只对基于分子滤波的分析算法进行了研讨。
运动标点分析的目的即是找到同一标点在不同帧中的位置。传统的标点跟踪办法只有:模型一致法、流光法、加尔门和扩展加尔门等办法,模型一致法也即是通过要检测的标点的模型与图象中全部的未知物体进行比较。如果某一未知物体与该模型一致,则该物体即被检测出来,认为是与模型相同的物体,这是一种简单的标点分析办法,它完毕起来也比较容易,但一致历程的搜索空间会随着图象大小和模型大小的增大而急剧增加,若非有专门的硬件支持,否则这种办法会非常浪费时间,大大降低标点分析的效率;流光法是分析标点运动的常用办法,但在强杂波和强噪声图象背景下,流光分析办法是不稳妥的:加尔门滤波是有效的线性最优推测科技,但不能处理非线性和非高思状况。
人们为此曾提出了Kaman Etended Filtter状况推测科技,但其状况推测的有效性仍然严重依赖范围模型的精确性,而建立精确的范围模型是非常困难的。近年来为了更好的处理非线性非高思情况下的运动范围状况推测问题,人们提出了分子滤(Particle Filter),分子滤波又叫Bayesian Bootstrap Filter或Monte Carlo Filter是以Monte Carlo随机模拟理论为根基,通过范围状况后验分布用一组加权随机模拟理论为根基,新的状况分布利用这些随机抽样Bayesian迭代进化产生。当今分子滤波已成为视觉分析,机械学习和机械人确定等领域的一研讨热点。
一、分子滤波的声图像分析
拜页思滤波与分子滤波器无论是在航天航空还是在自动化,通讯等各个领域,都广泛存在“推测”的问题。所谓“推测”,即是从带有随机误差的观察数据中推测出某些参考数值或某些状况变量。对于图象分析来说,利用对标点的观察(即获取每帧图象),可以对标点每一时间的运动状况进行推测。这时标点的运动状况可以包括标点的位置,姿态,大小等等。推测问题基本分为三类:从当前和过去的观察值来推测讯号的当前值,称为滤波;从过去的观察值来推测讯号的现在值或通过来值,称为预测或外推;从过去的观察值来推测过去的讯号值,称为平滑或内插。对于图象分析来说,滤波的目的即是根据当前时间获得的图象和之前所获得的图象,对标点当前时间的运动状况进行推测。
运动空间模型是一个非常重要的统计分析工具,它用范围方程来描述状况随时间演变的历程,并用观察方程来描述与状况有关的噪声变量。拜页思滤波理论基于上述运动空间模型的递推结构,利用全部的已知讯息来建造范围状况变量的后验几率密度,利用范围模型预测状况的先验几率,再利用最新的观察值进行修正得到后验几率密度,这样它就包括了观察值和先验知识在内的全部可利用的讯息,推测误差较小。另外,拜页思滤波通过未知参考数值看作随机变量,得到的推测值是该变量的一个特定完毕,所以拜页思推测适合于处理非线性和非高思范围的状况推测问题。
蒙得加洛办法又称为随机抽选法或统计试验办法,其基本思路是把实际求解的问题描述成某种随机变量,然后从已知几率分布抽选,最后建立各种推测量。蒙得加洛办法特别适用于无法用数学工具进行精确描述的场合,分子滤波办法是蒙得加洛办法和拜页思办法的结合,是求解拜页思推测问题的一个实用算法。分子滤波的中心思想是用一组加权的随机抽样。当抽样数足够多时,可以近似于真实的后验几率分布。范围运动求解由拜页思迭代推理历程完毕,分子滤波算法不用满足范围为线性,噪声高思分布,后验几率也是高思型的限制条件,所以应用面更广。同样因为分子滤波具有拜页思滤波的时域递推构型,所以不用储存全部时间的历史数据,运算时也只需要上一时间的推测值和当前时间的观察值,对运算机的储存要求小,增加了运算速度。
本文中所探讨的均是基于识别的标点分析办法,综上所述,对标点的分析即是在声图象序列中寻找与标点相一致的部位,这个寻找的历程利用对标点状况进行推测来完毕。通过分子滤波这种实用的推测问题求答案办法引入声图象分析领域,建造出基于分子滤波的分析框图,并结合标点各个层次的特点,建造性能良好的分析器,实验证明分子滤波分析办法具有良好的鲁棒性。
二、分析的办法及目的
为简化分析问题,本文只考虑平移模型,需要求解标点的两个运动参考数值T=TX,TY,其中T,X和T,Y分别为水平方向和垂直方向的标点中心点的位置。这样一个分子点就表示标点的一种可能的运动状况,即具有一组可能的运动参考数值(T)。根据分子的运动参考数值,即可求出该分子所对应的标点模型的一种变形情况,利用运算这个变形模型与实际图象的相关值,对分子赋予与相关值成比例的权值,由分子加权来表示标点状况的后验几率。
标点的先验知识标点的先验知识包括图象模型和标点的初始运动参考数值。标点模型具有一定的先验特点,基本认为是区别其他标点的特点,例如标点的色度特点,轮廓,和分布色度等。用于描述标点的“模型”是标点某些特点量的集合,根据对先验知识的利用程度,我们通过其分为三类:第一类是利用图象部位区域象素点的色度构成的模型;第二类是以图象的底层特点构成的模型,以轮廓为代表;第三类是图象的高层特点构成的模型,基本具有语义性质,并一致人类的一些视觉特点,例如Gabbor小波特点等。本文选择用色度分布来描述标点,并利用比较标点抽样和参考标点的灰度分布,建立范围观察模型,同样标点的色度分布和描述的是一种比较适当的标点描述方法,它能减轻标点的部位遮盖,翻转和型变对分析算法的影响。这种办法的缺点是如果没有更新模型,分析的稳定性通过性下降,但本文通过声图象先处理成二值图象再分析,这种缺点不是非常显著。