论文部分内容阅读
摘要利用兴义新一代多普勒天气雷达CINRAD/CD复合体扫基数据及气象产品风暴单体识别与跟踪SCIT,对发生在黔西南地区的2007~2008年的冰雹天气过程个例进行验证、分析,分别从识别、跟踪评估、位置预报3个方面进行评估分析,并进行了算法补尝,提出了解决的办法,在降低反射率因子识别的基础上在时间关联中增加一个方向性阈值,提取反射率因子水平结构ZSIGN、反射率因子空间变化率ZH、垂直累积液态含水量VIL、冰雹概率SHI 4个最能描述对流风暴特征的物理量,并对其分配权重,建立概率判别函数P,对2008年3月19日一次超级单体风暴的发展演变过程中P变化进行了分析,对2007~2008年的冰雹天气过程重新进行评估,与算法改进前的评估效果进行对比分析,结果表明,算法改进后识别成功率有明显上升,但对单体的跟踪及位置预报效果不明显。
关键词冰雹云; 单体识别与跟踪;算法评估;检验改进
中图分类号S161;P412.25文献标识码
A文章编号0517-6611(2015)07-199-04
Hail Cell Identification and Tracking Algorithm for Assessment and Improvement
TANG Hao-peng (Meteorological Office of Southwestern Guizhou, Xingyi, Guizhou 562400)
Abstract Using the Xingyi new generation of Doppler weather radar complex scan data and storm cell identification and tracking algorithm, the hail weather courses occurring in southwest Guizhou Province in 2007 and 2008 were assessed from the three aspects: identification, tracking, location prediction. The unfavorable situation for algorithm assessment is made analysis and compensation and proposed solution. On the basis of lower the reflectivity thresholds and adding the direction thresholds in the time association, the four physical alteration were calculated including the level reflectivity gradient, the vertical reflectivity gradient, vertically integrated liquid water content, and the strong hail index, which can best describe the storm cell, then distributed the coefficient respectively. The probability distinction function P was established. Using the probability distinction function P, the supercell on March 19th, 2008, was analyzed, then the hail weather courses in 2007 and 2008 were re-assessed, and the comparative results show that the improved algorithm enhances the identification effect to some extent, but the effect of tracking and location prediction weren’t obvious.
Key words Hail cloud; Cell identification and tracking; Algorithm evaluation; Inspection and improvement
20世纪以来,国内外雷达气象学者在雷达探测强对流天气系统应用上做了大量的工作,特别是在如何探测强对流天气系统上做了大量的努力,深入地分析了风暴发展、成熟、消亡及其移向移速的物理机制,提出了风暴的一些识别方法。如Rinchart提出应用模式来识别风暴单体及利用相关技术分析法对整幅回波图像进行处理[1];Austin等提出了三维矩心识别方法[2],Rosefeld对这一方法进行改进,提出通过对风暴形状的几何推理来处理分裂和合并[3];Johnson等提出了利用7个反射率因子识别阈值来代替此前唯一的阈值及采取特征核抽取技术并对空间相距较近的多个风暴单体进行合并或删除处理,该算法被WSR-88D的Build 9.0广泛采用,称为B9SI算法[4]。目前,我国的新一代天气雷达大多使用WSR-88D的Build 9.0的风暴算法,即风暴单体识别与跟踪算法,简称SCIT(Storm Cell Identification and Tracking)算法[5]。
随着我国多普勒天气雷达建设及业务组网的实施,用雷达来探测冰雹、暴雨等强对流天气已经成为一种比较重要的手段,准确的风暴识别和跟踪是雷达及强天气预警业务的基本组成部分。雷达终端系统提供了反射率因子、平均径向速度、谱宽3种基本数据产品,基本数据产品经过雷达产品生成器RPG(Radar Products Generator)处理后可生成39种产品[6],其中58号产品为风暴追踪产品,采用的是风暴单体识别与跟踪算法,但由于此算法设计是针对S波段的,而气候及地理环境复杂的黔西南地区的雷达是C波段。针对 SCIT算法对CINRAD/CD雷达的应用效果如何、如何进行本地化问题,笔者在此利用兴义新一代多普勒天气雷达CINRAD/CD复合体扫基数据及气象产品风暴单体识别与跟踪SCIT,对发生在黔西南地区的2007~2008年的冰雹天气过程个例进行验证、分析。 1资料与分析
SCIT算法用于识别风暴单体并追踪它的信息,其中包括移动方向、移动速度等。首先要在雷达径向上找寻大的反射率因子区,而后在二维锥面上找寻大的反射率因子区,再给这些二维的分量寻求垂直相关。SCIT采用了多阈值识别、特征核抽取、2D单体识别和相近单体处理等多种新技术[7]。
笔者研究的区域是贵州省黔西南地区(以兴义多普勒天气雷达为圆心,半径150 km),研究对象是发生在2007~2008年的冰雹天气过程。由于雷达存在静锥区,距离太近探测不到风暴上层,会使探测效果降低,而受地球曲率和雷达自身探测能力的影响,超过150 km也会使探测效果降低[8],因此在此主要研究距雷达站中心10~150 km范围内的对流单体。由于一次天气过程中可能有多个不同类型的单体存在,故选取过程中产生冰雹或大于45 dBz的单体91个作为评估样本。地面降雹时间、降雨量以乡镇雨量站记录为准。
2算法评估
选取2007~2008年发生的20次冰雹天气过程作统计分析,SCIT算法共识别出风暴单体257个,从中分离出91个对流旺盛的单体,首先选择造成灾害性天气的风暴,其次选择最大反射率因子超过45 dBz的风暴。这91个对流单体中有75个最终实况验证为冰雹云,其余16个没有降雹,用SCIT算法对这91个单体分别作识别、跟踪、位置预报分析。
2.1单体识别的评估
为更好地量化评估效果,根据表1的列联系数,这里引入命中率POD、误警率FAR和临界成功指数CSI,
其中POD=XX+Y、FAR=ZX+Z、CSI=XX+Y+Z。
表1中X代表冰雹事件发生,且SCIT算法探测到;Y代表冰雹事件发生,但SCIT算法没有探测到;Z代表冰雹事件没有发生,但SCIT却探测到冰雹。命中率POD代表事件发生的总次数中SCIT探测到的次数所占的比率;误警率FAR代表事件没有发生的次数占SCIT探测总次数的比率;CSI代表POD和FAR的综合效应[7]。
表1列联系数
是否发生冰雹探测到冰雹没有探测到冰雹
发生冰雹XY
未发生冰雹Z-
75个冰雹云单体中,SCIT探测到的个数为72个,另外,3个冰雹云没有探测到, 16个非冰雹云单体中SCIT错误的探测到冰雹云10个,其余6个探测结果正确为“非冰雹云”。POD、FAR、CSI的具体评分结果分别为96.3%、11.4%、85.7%,可见SCIT算法对冰雹云识别较好,75个冰雹云中有72个被识别出来,约占96%,但存在漏报,有3个冰雹云未被识别出来;在非冰雹云的识别中,识别效果较差,16个非冰雹云单中仅有6个被正确识别,约为37.5%,相比而言误差率较高,16个非冰雹云单体中有10个被误报为冰雹云,误报率为62.5%。对3个漏报的冰雹云进行分析,发现这3个冰雹云强度并不强,在45 dBz左右,单体之间间隔较小,面积较小,风场的辐合辐散及气流的旋转较强,且这3个漏报的冰雹云均是发生在8~9月;在误报的这10个非冰雹云中,强度梯度较小,这10个非冰雹云强度较强,约为50 dBz,面积大,强中心面积相对小,且这误报的10个非冰雹云均是发生在5~7月。
2.2单体跟踪的评估
在单体跟踪中最重要的是正确地进行时间关联,对在2个相继体扫中识别的风暴单体进行时间相关处理以确定第一个被识别的风暴单体的路径。先是一个体扫接一个体扫地跟踪所有被识别单体的生命周期,再是确定不正确的时间关联的个数并记下它们的特性,最后计算该算法正确跟踪的单体占所有被跟踪单体的百分比[7]。其中时间关联的数量是单体从存在到消亡的全部体扫个数。对这91个单体样本进行跟踪评估,发现单体跟踪评估(第1个正确时间关联的百分比)较高,为92%,第2个正确时间关联的百分比迅速下降,为80%,第3个正确时间关联更低,仅为52%。
大多数时间关联误差发生在2个空间上挨得很近的单体上,特别是当这些挨得很近的单体正处于增长或衰退阶段时更容易产生误差。从2008年5月1日一次冰雹过程中的一个超级单体风暴的时间误差的个例分析(图1)可以看出,图1a组合反射率因子的图像上,风暴跟踪信息显示一个新的单体D0正在生成,在图1b中,风暴跟踪信息也显示出了这个新的单体D0且错误地将它与正在消散的V0相联系。
图12008年5月1日18:59(a)和17:05(b)风暴跟踪图像个例(38号产品组合反射率因子上叠加58号产品风暴跟踪信息)
2.3单体位置预报的评估
用选取的这91个单体(每个单体的生命史至少为2个体扫)对SCIT算法的单体位置预报精度进行分析,评估结果显示,5 min的平均预报误差最小,仅为2.2 km,15 min的平均预报误差为5.8 km,而30 min的平均预报误差较大,达9.6 km。可见,预报时效与平均预报误差呈正相关,预报时效愈长,则平均预报误差愈大。
3算法改进与对比分析
3.1算法改进理论分析
SCIT算法使用反射率因子、风暴段的长度和风暴单体分量等阈值,且它要求在距雷达一定距离阈值范围内至少相继2个仰角的信息才能确定一个风暴单体。一个风暴段定义为一段连续的、沿着一个径向的一系列距离库。因此该算法不能识别以下3类单体:在径向长度上或在面积上小的单体、最大反射率因子<30 dBz的单体、浅薄的不能通过几个相继仰角就消失的单体。如果风暴单体紧挨在一起,SCIT算法可能会将单体合并且将若干个紧挨着的单体识别为一个单体[7],对于识别出的风暴不能给出其内部对流情况,导致反射率因子强度较弱、但对流活跃的单体被遗漏,处理相近多单体时没有优势[5]。在此在充分考虑了地理环境、气候背景的前提下,针对识别效果不太理想的情况,提出解决的办法,具体如下。 3.1.1降低识别阈值。将SCIT的7个反射率阈值降低一个等级(55、50、45、40、35、30、25 dBz)。
3.1.2在时间关联中加上一个方向性阈值。当新旧单体相距很近时,由于前进方向上偏差很大,而新单体又在旧单体的距离阈值之内,所以这时很容易产生偏差,这样这2个单体间的时间关联是明显不对的。这种类型的错误可以通过在时间关联中加上一个方向性阈值来解决[7]。
3.1.3提取反射率因子水平梯度ZSIGN。ZSIGN提取了沿径向上相邻距离库的反射率因子差的平均信息。若(Zi+1-Zi)>0,则ZSIGN=1;若(Zi+1-Zi)=0,则ZSIGN=0;若(Zi+1-Zi)<0,则ZSIGN=-1。
所以ZSIGN=Ni=1ZSIGNN。
通过统计设计出ZSIGN的隶属函数,ZSIGN≥0.9的风暴对流旺盛,因此将超过0.9的ZSIGN值对应于最大匹配1,ZSIGN≤0.2的风暴隶属函数匹配为0,0.2 F(ZSIGN)=1ZSIGN>0.9
1.11ZSIGN0.5 2.0(ZSIGN-0.2)0.2 0ZSIGN≤0.2
3.1.4提取反射率因子垂直梯度因子ZH[5]。风暴处于成熟阶段时,其典型特征之一就是核区内反射率因子垂直递减率接近于0,因此反射率因子垂直梯度接近0时,表示此时的风暴的对流性最强,相反,则表示风暴的对流性很弱。由于风暴在不同生命阶段,其高度和强度是变化的,为此选择在单体最大反射率因子上方4 km的厚度层内进行计算,若H2-H0≤4 km,ZH=-Z2-Z0H2-H0,否则,ZH=-Z1-Z0H1-H0。
当风暴处于成熟阶段时,其隶属函数对应于最大程度的匹配1,当递减率远大于0时,则匹配隶属函数为0。具体数学表达式如下:
F(ZH)=10≤ZH≤0.4
1-ZH-0.440.4 0ZH<0或ZH>5
3.1.5
垂直累积液态水含量[5]。在假设反射率因子是完全由液态水反射得到的前提下,垂直累积液态水表示将反射率因子数据转换成等价的液态水值。该参数对于区分强雷暴有很好的利用价值,在此选取了风暴单体内的对流发展到成熟这一回波最强阶段所对应的垂直累积液态水含量QVIL。根据历史资料统计可知,当QVIL>35 g/m2产生冰雹的概率为100%,而当QVIL为15~35 g/m2不确定是否产生冰雹,而当QVIL<15时则一定不会产生冰雹。具体数学表达式如下:
F(QVIL)=1QVIL>35
QVIL15-115 0QVIL≤15
43卷7期
唐浩鹏冰雹云单体识别与跟踪算法评估及检验改进
3.1.6强冰雹指数SHI。强冰雹主要指冰雹尺寸>20 mm的冰雹,为了确定强冰雹的存在,主要采用类似于垂直累积液态含水量VIL算法的处理方法。首先引入强冰雹指数SHI的概念:
SHI=0.1∫HTH0WTEdH,式中,WT为大气温度层结的权重函数,E为冰雹动能,H0为溶化层高度,HT为风暴单体顶高。由统计资料可知,当ZSHI>200 J/(m·s)时产生冰雹的概率为100%,而当ZSHI值为100~200 J/(m·s)时不确定是否产生冰雹,而当ZSHI<100时则一定不会产生冰雹[8]。具体数学表达式如下:
F(ZSHI)=1ZSHI≥200
0.5100≤ZSHI<200
0ZSHI<100
在气象预报中,一些预报量常分成若干级别或类别,可以利用不同因子的前期数据,寻找因子与预报量的关系,建立针对不同类型的预报时的方程式[9]:y=c1x1+c2x2+…+cpxp,此方程称为判别方程,其中,y为新的变量,称为判别函数,x1、x2、…、xp为前期因子,c1、c2、…、cp称为判别系数,p为因子的数量。
在判别风暴单体识别与跟踪时由于涉及到多个因子,因此,在降低反射率因子阈值及增加一个方向阈值的基础上,构建反射率因子水平梯度ZSIGN、反射率因子垂直梯度因子ZH、垂直累积液态水含量、强冰雹指数SHI这4个因子为一个完备事件组,设它们概率和为1,建立判别概率函数P[10]:P=c1F(ZSIGN)+c2F(ZH)+c3F(VIL)+c4F(SHI)。
据统计资料可知这4个因子对风暴发展均有重要影响,因此在分配权重时,这4个因子被赋予相同的权重,即在这个公式中,c1=c2=c3=c4=0.25。根据每一个物理因子所描述的对流特征,利用隶属函数计算该因子与其所描述的对流性特征相匹配的概率P。
选取2008年3月19日一次降雹天气过程(18:02~21:47),对此过程中的一个降雹超级单体风暴演变过程用判别概率函数P进行计算,从其降雹前、降雹中、降雹后P变化(图2)可以看出,概率函数P在18:21~18:40和19:11~19:23内有明显的增长,这与雷达产品VIL、组合反射率因子、冰雹概率等产品分析出的2次增长过程相对应,在19:23~19:36对流指数最大,达100%,与之相对应的地面此时正在降冰雹;之后对流指数在维持较高一段时间后,开始减弱,雷达观测数据显示,对应的回波高度、VIL明显降低,速度场气流趋于平稳,下沉气流逐渐占主导地位,但强度场变化不明显,短期内仍维持一个较高的数值。
3.2算法改进前后评估结果对比分析
在SCIT算法的基础上,增加上述提出的6个改进因子对这91个单体重新进行评估,评估结果与改进前的效果进行对比分析,结果显示,改进后的评估效果有所提高,其中,算法改进后识别率评估效果较之其他两项稍好,提高了9.3%,而单体跟踪评估(第1个正确时间关联的百分比)及15 min单体位置评估提高率分别为2%、0.1 km,效果较差[11]。单体的识别临界成功指数虽然明显提高,但也会产生一些空报及漏报,91个单体中有85个被准确识别,其中,75个冰雹云中有1个被漏报,这个漏报单体强中心面积小,强度梯度小,时间位于夏末秋初,速度场气流环境结构不太稳定。16个非冰雹云中仍有5个被误报为冰雹云,这5个单体的强中心强度均为50 dBz以上,强中心面积较大,但强度梯度小,回波整体面积大,速度场气流环境场结构较稳定,时间均位于5~7月[12]。由于此次算法改进中6项中只有一项考虑了单体的移动,所以此次算法对单体的跟踪及位置预报改进效果较差。 图22008年3月19日一个超级单体风暴演变过程中的判别概率函数P变化
4小结
通过增加上述6个改进后,对单体二次评估可知效果有所提高,但仍有误差,特别是对单体的跟踪及位置预报提高效果不明显。其误差原因是多种原因造成的,不仅在于算法本身,还与地理环境、天气环流背景、雷达初始基数据的精确性等有关[13]。
适当降低反射率因子阈值会导致虚报率的提高,究竟阈值多少是最合适的,是因地而异的,且因季节的不同也会导致阈值的不同,即使是同一部雷达在同一个地方探测,它的反射率因子阈值也会因季节、参数、地理、环流背景、中小尺度系统的不同而有所改变。究竟反射率阈值为多少才是最合适的,要依靠大量的统计数据来进行分析总结。另外,在时间关联中加上一个方向性阈值,可以提高风暴跟踪信息,
但增加方向性阈值只是其中一个方向,还有更多的方向需要深入探讨,如谱宽资料、径向速度等。判别概率函数P的建立在一定程度上给出了识别冰雹云的综合指标,但其匹配隶属函数及其权重如何确定是一个复杂的问题,各个因子作出的贡献如何界定,对于不同类型的单体又如何加以细分,这些都是以后进一步研究的方向。
参考文献
[1]
RINCHART R E.A pattern recognition technique for use with convention weather radar to detemine internal storm motion,rencent progress in radar meteorology[J].Atmospheric Tech,1981,13:119-134
[2] AUSTIN G L,BELLON.Very short-range forecast of precipitation by the objective extrapolation of radar and satelite data[M]//BRONING K.Nowcasting. Academic Press,1982:177-190.
[3] ROSEFELD D.Object method for analysis and tracking of convective cells as seen by radar[J] .J Atmos Oceanic Tech,1987,4:422-434.
[4] JOHNSON J T,MAC KEEN P L,WITT A,et al.The storm cell identification and tracking algorithm:an enhanced WSR-88D algorithm[J].Weather and Forecasting,1998,13:263-276.
[5] 胡胜,顾松山,庄旭东,等.风暴的多普勒雷达自动识别[J].气象学报,2006,64(6):797-808.
[6] 王芬,李腹广,李赟.新一代多普勒天气雷达CINRAD/CD产品数据缺报原因分析[J].气象与环境科学,2010,33(4):84-88.
[7] 俞小鼎,姚秀萍,熊廷南,等.多普勒天气雷达原理与业务应用[M].北京:气象出版社,2005:187-197.
[8] 王芬,李腹广.多普勒天气雷达冰雹探测算法评估及检验改进[J]. 气象科技,2009,37(3):345-348.
[9] 黄嘉佑. 气象统计分析与预报方法[M]. 北京:气象出版社,2004.
[10] 袁荫棠.概率论与数理统计[M].北京:中国人民大学出版社,2005.
[11] 王爽,吕环宇,郭志刚,等. 一次强降水超级单体风暴过程分析气象与环境学报[J].气象与环境学报,2007, 23(2):15-20.
[12] 张维全,李闻生,李洋. 新一代天气雷达VIL产品修正方法初探[J].气象与环境学报,2006,22(2):11-17.
[13] 王锡军.大连地区一次暴雨过程雷达回波分析[J].气象与环境学报,2001,17(2):12-13.
关键词冰雹云; 单体识别与跟踪;算法评估;检验改进
中图分类号S161;P412.25文献标识码
A文章编号0517-6611(2015)07-199-04
Hail Cell Identification and Tracking Algorithm for Assessment and Improvement
TANG Hao-peng (Meteorological Office of Southwestern Guizhou, Xingyi, Guizhou 562400)
Abstract Using the Xingyi new generation of Doppler weather radar complex scan data and storm cell identification and tracking algorithm, the hail weather courses occurring in southwest Guizhou Province in 2007 and 2008 were assessed from the three aspects: identification, tracking, location prediction. The unfavorable situation for algorithm assessment is made analysis and compensation and proposed solution. On the basis of lower the reflectivity thresholds and adding the direction thresholds in the time association, the four physical alteration were calculated including the level reflectivity gradient, the vertical reflectivity gradient, vertically integrated liquid water content, and the strong hail index, which can best describe the storm cell, then distributed the coefficient respectively. The probability distinction function P was established. Using the probability distinction function P, the supercell on March 19th, 2008, was analyzed, then the hail weather courses in 2007 and 2008 were re-assessed, and the comparative results show that the improved algorithm enhances the identification effect to some extent, but the effect of tracking and location prediction weren’t obvious.
Key words Hail cloud; Cell identification and tracking; Algorithm evaluation; Inspection and improvement
20世纪以来,国内外雷达气象学者在雷达探测强对流天气系统应用上做了大量的工作,特别是在如何探测强对流天气系统上做了大量的努力,深入地分析了风暴发展、成熟、消亡及其移向移速的物理机制,提出了风暴的一些识别方法。如Rinchart提出应用模式来识别风暴单体及利用相关技术分析法对整幅回波图像进行处理[1];Austin等提出了三维矩心识别方法[2],Rosefeld对这一方法进行改进,提出通过对风暴形状的几何推理来处理分裂和合并[3];Johnson等提出了利用7个反射率因子识别阈值来代替此前唯一的阈值及采取特征核抽取技术并对空间相距较近的多个风暴单体进行合并或删除处理,该算法被WSR-88D的Build 9.0广泛采用,称为B9SI算法[4]。目前,我国的新一代天气雷达大多使用WSR-88D的Build 9.0的风暴算法,即风暴单体识别与跟踪算法,简称SCIT(Storm Cell Identification and Tracking)算法[5]。
随着我国多普勒天气雷达建设及业务组网的实施,用雷达来探测冰雹、暴雨等强对流天气已经成为一种比较重要的手段,准确的风暴识别和跟踪是雷达及强天气预警业务的基本组成部分。雷达终端系统提供了反射率因子、平均径向速度、谱宽3种基本数据产品,基本数据产品经过雷达产品生成器RPG(Radar Products Generator)处理后可生成39种产品[6],其中58号产品为风暴追踪产品,采用的是风暴单体识别与跟踪算法,但由于此算法设计是针对S波段的,而气候及地理环境复杂的黔西南地区的雷达是C波段。针对 SCIT算法对CINRAD/CD雷达的应用效果如何、如何进行本地化问题,笔者在此利用兴义新一代多普勒天气雷达CINRAD/CD复合体扫基数据及气象产品风暴单体识别与跟踪SCIT,对发生在黔西南地区的2007~2008年的冰雹天气过程个例进行验证、分析。 1资料与分析
SCIT算法用于识别风暴单体并追踪它的信息,其中包括移动方向、移动速度等。首先要在雷达径向上找寻大的反射率因子区,而后在二维锥面上找寻大的反射率因子区,再给这些二维的分量寻求垂直相关。SCIT采用了多阈值识别、特征核抽取、2D单体识别和相近单体处理等多种新技术[7]。
笔者研究的区域是贵州省黔西南地区(以兴义多普勒天气雷达为圆心,半径150 km),研究对象是发生在2007~2008年的冰雹天气过程。由于雷达存在静锥区,距离太近探测不到风暴上层,会使探测效果降低,而受地球曲率和雷达自身探测能力的影响,超过150 km也会使探测效果降低[8],因此在此主要研究距雷达站中心10~150 km范围内的对流单体。由于一次天气过程中可能有多个不同类型的单体存在,故选取过程中产生冰雹或大于45 dBz的单体91个作为评估样本。地面降雹时间、降雨量以乡镇雨量站记录为准。
2算法评估
选取2007~2008年发生的20次冰雹天气过程作统计分析,SCIT算法共识别出风暴单体257个,从中分离出91个对流旺盛的单体,首先选择造成灾害性天气的风暴,其次选择最大反射率因子超过45 dBz的风暴。这91个对流单体中有75个最终实况验证为冰雹云,其余16个没有降雹,用SCIT算法对这91个单体分别作识别、跟踪、位置预报分析。
2.1单体识别的评估
为更好地量化评估效果,根据表1的列联系数,这里引入命中率POD、误警率FAR和临界成功指数CSI,
其中POD=XX+Y、FAR=ZX+Z、CSI=XX+Y+Z。
表1中X代表冰雹事件发生,且SCIT算法探测到;Y代表冰雹事件发生,但SCIT算法没有探测到;Z代表冰雹事件没有发生,但SCIT却探测到冰雹。命中率POD代表事件发生的总次数中SCIT探测到的次数所占的比率;误警率FAR代表事件没有发生的次数占SCIT探测总次数的比率;CSI代表POD和FAR的综合效应[7]。
表1列联系数
是否发生冰雹探测到冰雹没有探测到冰雹
发生冰雹XY
未发生冰雹Z-
75个冰雹云单体中,SCIT探测到的个数为72个,另外,3个冰雹云没有探测到, 16个非冰雹云单体中SCIT错误的探测到冰雹云10个,其余6个探测结果正确为“非冰雹云”。POD、FAR、CSI的具体评分结果分别为96.3%、11.4%、85.7%,可见SCIT算法对冰雹云识别较好,75个冰雹云中有72个被识别出来,约占96%,但存在漏报,有3个冰雹云未被识别出来;在非冰雹云的识别中,识别效果较差,16个非冰雹云单中仅有6个被正确识别,约为37.5%,相比而言误差率较高,16个非冰雹云单体中有10个被误报为冰雹云,误报率为62.5%。对3个漏报的冰雹云进行分析,发现这3个冰雹云强度并不强,在45 dBz左右,单体之间间隔较小,面积较小,风场的辐合辐散及气流的旋转较强,且这3个漏报的冰雹云均是发生在8~9月;在误报的这10个非冰雹云中,强度梯度较小,这10个非冰雹云强度较强,约为50 dBz,面积大,强中心面积相对小,且这误报的10个非冰雹云均是发生在5~7月。
2.2单体跟踪的评估
在单体跟踪中最重要的是正确地进行时间关联,对在2个相继体扫中识别的风暴单体进行时间相关处理以确定第一个被识别的风暴单体的路径。先是一个体扫接一个体扫地跟踪所有被识别单体的生命周期,再是确定不正确的时间关联的个数并记下它们的特性,最后计算该算法正确跟踪的单体占所有被跟踪单体的百分比[7]。其中时间关联的数量是单体从存在到消亡的全部体扫个数。对这91个单体样本进行跟踪评估,发现单体跟踪评估(第1个正确时间关联的百分比)较高,为92%,第2个正确时间关联的百分比迅速下降,为80%,第3个正确时间关联更低,仅为52%。
大多数时间关联误差发生在2个空间上挨得很近的单体上,特别是当这些挨得很近的单体正处于增长或衰退阶段时更容易产生误差。从2008年5月1日一次冰雹过程中的一个超级单体风暴的时间误差的个例分析(图1)可以看出,图1a组合反射率因子的图像上,风暴跟踪信息显示一个新的单体D0正在生成,在图1b中,风暴跟踪信息也显示出了这个新的单体D0且错误地将它与正在消散的V0相联系。
图12008年5月1日18:59(a)和17:05(b)风暴跟踪图像个例(38号产品组合反射率因子上叠加58号产品风暴跟踪信息)
2.3单体位置预报的评估
用选取的这91个单体(每个单体的生命史至少为2个体扫)对SCIT算法的单体位置预报精度进行分析,评估结果显示,5 min的平均预报误差最小,仅为2.2 km,15 min的平均预报误差为5.8 km,而30 min的平均预报误差较大,达9.6 km。可见,预报时效与平均预报误差呈正相关,预报时效愈长,则平均预报误差愈大。
3算法改进与对比分析
3.1算法改进理论分析
SCIT算法使用反射率因子、风暴段的长度和风暴单体分量等阈值,且它要求在距雷达一定距离阈值范围内至少相继2个仰角的信息才能确定一个风暴单体。一个风暴段定义为一段连续的、沿着一个径向的一系列距离库。因此该算法不能识别以下3类单体:在径向长度上或在面积上小的单体、最大反射率因子<30 dBz的单体、浅薄的不能通过几个相继仰角就消失的单体。如果风暴单体紧挨在一起,SCIT算法可能会将单体合并且将若干个紧挨着的单体识别为一个单体[7],对于识别出的风暴不能给出其内部对流情况,导致反射率因子强度较弱、但对流活跃的单体被遗漏,处理相近多单体时没有优势[5]。在此在充分考虑了地理环境、气候背景的前提下,针对识别效果不太理想的情况,提出解决的办法,具体如下。 3.1.1降低识别阈值。将SCIT的7个反射率阈值降低一个等级(55、50、45、40、35、30、25 dBz)。
3.1.2在时间关联中加上一个方向性阈值。当新旧单体相距很近时,由于前进方向上偏差很大,而新单体又在旧单体的距离阈值之内,所以这时很容易产生偏差,这样这2个单体间的时间关联是明显不对的。这种类型的错误可以通过在时间关联中加上一个方向性阈值来解决[7]。
3.1.3提取反射率因子水平梯度ZSIGN。ZSIGN提取了沿径向上相邻距离库的反射率因子差的平均信息。若(Zi+1-Zi)>0,则ZSIGN=1;若(Zi+1-Zi)=0,则ZSIGN=0;若(Zi+1-Zi)<0,则ZSIGN=-1。
所以ZSIGN=Ni=1ZSIGNN。
通过统计设计出ZSIGN的隶属函数,ZSIGN≥0.9的风暴对流旺盛,因此将超过0.9的ZSIGN值对应于最大匹配1,ZSIGN≤0.2的风暴隶属函数匹配为0,0.2
1.11ZSIGN0.5
3.1.4提取反射率因子垂直梯度因子ZH[5]。风暴处于成熟阶段时,其典型特征之一就是核区内反射率因子垂直递减率接近于0,因此反射率因子垂直梯度接近0时,表示此时的风暴的对流性最强,相反,则表示风暴的对流性很弱。由于风暴在不同生命阶段,其高度和强度是变化的,为此选择在单体最大反射率因子上方4 km的厚度层内进行计算,若H2-H0≤4 km,ZH=-Z2-Z0H2-H0,否则,ZH=-Z1-Z0H1-H0。
当风暴处于成熟阶段时,其隶属函数对应于最大程度的匹配1,当递减率远大于0时,则匹配隶属函数为0。具体数学表达式如下:
F(ZH)=10≤ZH≤0.4
1-ZH-0.440.4
3.1.5
垂直累积液态水含量[5]。在假设反射率因子是完全由液态水反射得到的前提下,垂直累积液态水表示将反射率因子数据转换成等价的液态水值。该参数对于区分强雷暴有很好的利用价值,在此选取了风暴单体内的对流发展到成熟这一回波最强阶段所对应的垂直累积液态水含量QVIL。根据历史资料统计可知,当QVIL>35 g/m2产生冰雹的概率为100%,而当QVIL为15~35 g/m2不确定是否产生冰雹,而当QVIL<15时则一定不会产生冰雹。具体数学表达式如下:
F(QVIL)=1QVIL>35
QVIL15-115
43卷7期
唐浩鹏冰雹云单体识别与跟踪算法评估及检验改进
3.1.6强冰雹指数SHI。强冰雹主要指冰雹尺寸>20 mm的冰雹,为了确定强冰雹的存在,主要采用类似于垂直累积液态含水量VIL算法的处理方法。首先引入强冰雹指数SHI的概念:
SHI=0.1∫HTH0WTEdH,式中,WT为大气温度层结的权重函数,E为冰雹动能,H0为溶化层高度,HT为风暴单体顶高。由统计资料可知,当ZSHI>200 J/(m·s)时产生冰雹的概率为100%,而当ZSHI值为100~200 J/(m·s)时不确定是否产生冰雹,而当ZSHI<100时则一定不会产生冰雹[8]。具体数学表达式如下:
F(ZSHI)=1ZSHI≥200
0.5100≤ZSHI<200
0ZSHI<100
在气象预报中,一些预报量常分成若干级别或类别,可以利用不同因子的前期数据,寻找因子与预报量的关系,建立针对不同类型的预报时的方程式[9]:y=c1x1+c2x2+…+cpxp,此方程称为判别方程,其中,y为新的变量,称为判别函数,x1、x2、…、xp为前期因子,c1、c2、…、cp称为判别系数,p为因子的数量。
在判别风暴单体识别与跟踪时由于涉及到多个因子,因此,在降低反射率因子阈值及增加一个方向阈值的基础上,构建反射率因子水平梯度ZSIGN、反射率因子垂直梯度因子ZH、垂直累积液态水含量、强冰雹指数SHI这4个因子为一个完备事件组,设它们概率和为1,建立判别概率函数P[10]:P=c1F(ZSIGN)+c2F(ZH)+c3F(VIL)+c4F(SHI)。
据统计资料可知这4个因子对风暴发展均有重要影响,因此在分配权重时,这4个因子被赋予相同的权重,即在这个公式中,c1=c2=c3=c4=0.25。根据每一个物理因子所描述的对流特征,利用隶属函数计算该因子与其所描述的对流性特征相匹配的概率P。
选取2008年3月19日一次降雹天气过程(18:02~21:47),对此过程中的一个降雹超级单体风暴演变过程用判别概率函数P进行计算,从其降雹前、降雹中、降雹后P变化(图2)可以看出,概率函数P在18:21~18:40和19:11~19:23内有明显的增长,这与雷达产品VIL、组合反射率因子、冰雹概率等产品分析出的2次增长过程相对应,在19:23~19:36对流指数最大,达100%,与之相对应的地面此时正在降冰雹;之后对流指数在维持较高一段时间后,开始减弱,雷达观测数据显示,对应的回波高度、VIL明显降低,速度场气流趋于平稳,下沉气流逐渐占主导地位,但强度场变化不明显,短期内仍维持一个较高的数值。
3.2算法改进前后评估结果对比分析
在SCIT算法的基础上,增加上述提出的6个改进因子对这91个单体重新进行评估,评估结果与改进前的效果进行对比分析,结果显示,改进后的评估效果有所提高,其中,算法改进后识别率评估效果较之其他两项稍好,提高了9.3%,而单体跟踪评估(第1个正确时间关联的百分比)及15 min单体位置评估提高率分别为2%、0.1 km,效果较差[11]。单体的识别临界成功指数虽然明显提高,但也会产生一些空报及漏报,91个单体中有85个被准确识别,其中,75个冰雹云中有1个被漏报,这个漏报单体强中心面积小,强度梯度小,时间位于夏末秋初,速度场气流环境结构不太稳定。16个非冰雹云中仍有5个被误报为冰雹云,这5个单体的强中心强度均为50 dBz以上,强中心面积较大,但强度梯度小,回波整体面积大,速度场气流环境场结构较稳定,时间均位于5~7月[12]。由于此次算法改进中6项中只有一项考虑了单体的移动,所以此次算法对单体的跟踪及位置预报改进效果较差。 图22008年3月19日一个超级单体风暴演变过程中的判别概率函数P变化
4小结
通过增加上述6个改进后,对单体二次评估可知效果有所提高,但仍有误差,特别是对单体的跟踪及位置预报提高效果不明显。其误差原因是多种原因造成的,不仅在于算法本身,还与地理环境、天气环流背景、雷达初始基数据的精确性等有关[13]。
适当降低反射率因子阈值会导致虚报率的提高,究竟阈值多少是最合适的,是因地而异的,且因季节的不同也会导致阈值的不同,即使是同一部雷达在同一个地方探测,它的反射率因子阈值也会因季节、参数、地理、环流背景、中小尺度系统的不同而有所改变。究竟反射率阈值为多少才是最合适的,要依靠大量的统计数据来进行分析总结。另外,在时间关联中加上一个方向性阈值,可以提高风暴跟踪信息,
但增加方向性阈值只是其中一个方向,还有更多的方向需要深入探讨,如谱宽资料、径向速度等。判别概率函数P的建立在一定程度上给出了识别冰雹云的综合指标,但其匹配隶属函数及其权重如何确定是一个复杂的问题,各个因子作出的贡献如何界定,对于不同类型的单体又如何加以细分,这些都是以后进一步研究的方向。
参考文献
[1]
RINCHART R E.A pattern recognition technique for use with convention weather radar to detemine internal storm motion,rencent progress in radar meteorology[J].Atmospheric Tech,1981,13:119-134
[2] AUSTIN G L,BELLON.Very short-range forecast of precipitation by the objective extrapolation of radar and satelite data[M]//BRONING K.Nowcasting. Academic Press,1982:177-190.
[3] ROSEFELD D.Object method for analysis and tracking of convective cells as seen by radar[J] .J Atmos Oceanic Tech,1987,4:422-434.
[4] JOHNSON J T,MAC KEEN P L,WITT A,et al.The storm cell identification and tracking algorithm:an enhanced WSR-88D algorithm[J].Weather and Forecasting,1998,13:263-276.
[5] 胡胜,顾松山,庄旭东,等.风暴的多普勒雷达自动识别[J].气象学报,2006,64(6):797-808.
[6] 王芬,李腹广,李赟.新一代多普勒天气雷达CINRAD/CD产品数据缺报原因分析[J].气象与环境科学,2010,33(4):84-88.
[7] 俞小鼎,姚秀萍,熊廷南,等.多普勒天气雷达原理与业务应用[M].北京:气象出版社,2005:187-197.
[8] 王芬,李腹广.多普勒天气雷达冰雹探测算法评估及检验改进[J]. 气象科技,2009,37(3):345-348.
[9] 黄嘉佑. 气象统计分析与预报方法[M]. 北京:气象出版社,2004.
[10] 袁荫棠.概率论与数理统计[M].北京:中国人民大学出版社,2005.
[11] 王爽,吕环宇,郭志刚,等. 一次强降水超级单体风暴过程分析气象与环境学报[J].气象与环境学报,2007, 23(2):15-20.
[12] 张维全,李闻生,李洋. 新一代天气雷达VIL产品修正方法初探[J].气象与环境学报,2006,22(2):11-17.
[13] 王锡军.大连地区一次暴雨过程雷达回波分析[J].气象与环境学报,2001,17(2):12-13.