论文部分内容阅读
摘要建立适宜的水位流量关系是水文资料整编工作的核心内容,但基于最小二乘法与残差平方和最小原则的传统水位流量关系曲线推求方法存在精度不高、难以兼顾绝对误差和相对误差等问题。为此,引入源于动物群体迁移行为的自由搜索(Free Search,FS)算法,以残差平方和、绝对残差绝对值和、相对残差绝对值和作为拟合准则,将FS单个动物每步探查行走时的位置向量作为一组参数值,利用FS算法的动物群体迁移行为直接拟合水位流量关系,从而推求最优的水位流量关系曲线。实例研究结果表明,利用FS率定水位流量关系曲线参数十分简便,寻优一次即可得到满意结果,且与目标规划法和遗傳算法相比,拟合精度总体有所提升。
关键词水位流量关系曲线;自由搜索;参数估计;最小二乘法;优化准则
中图分类号P337-3文献标识码
A文章编号0517-6611(2017)26-0179-03
Estimating Water Leveldischarge Curve by Free Search
PANG Hongwei1,WANG Bin2*,ZHU Shijiang3(1.Kaifeng Yellow River Management Office,Kaifeng,Henan 475000;2.College of Water Conservancy and Civil Engineering,Northeast Agricultural University,Harbin,Heilongjiang 150030;3.College of Hydraulic and Environmental Engineering,Three Gorges University,Yichang,Hubei 443002)
Abstract To establish the relationship between water level and discharge is an important job of hydrological data reorganization,but it is a low precision method of parameters calibration in water leveldischarge curve using least square method and minimum residual sum of square,and it is difficult to give consideration to the problems such as absolute error and relative error.In this paper,Free Search (FS),which derived from the animal group migration behavior,was used as a method for estimating water leveldischarge curves.The position vector of each exploratory step for the individual animal was ascertained as an initial water leveldischarge curve by FS.The simulation results showed that the satisfactory results could be achieved by FS for optimizing the water leveldischarge curves,and runoff simulation exhibits relatively high precision water leveldischarge compared with the goal programming method and genetic algorithm.
Key wordsWater leveldischarge curve; Free Search; Parameters estimation; Least square method; Optimization criteria
在天然河流测验断面长期开展流量测定工作比较困难。由于水位与流量关系密切,且水位随时间的变化过程易于观测,因而一般不需要连续观测流量过程,而是通过一定次数的实测水位与流量的对应资料建立水位与流量的关系曲线,再依据水位流量关系曲线,把水位变化过程转换为相应的流量变化过程,并计算出各种流量的特征值[1]。在水文站开展的流量资料整编内容虽多,但其中的核心工作就是建立水位流量关系,水位流量关系曲线法也因而成为流量资料整编中最常用、最基本的方法[2-3]。传统的水位流量关系曲线拟合方法基于最小二乘法,虽然能够得到最小的残差平方和,但求得的水位流量关系曲线不一定就是最优的拟合曲线,在拟合实测值时存在精度低等问题[4]。当采用绝对残差和、相对残差和的绝对值作为评价拟合准则,并采用目标规划法、遗传算法(Genetic Algorithm,GA)等方法率定水位流量关系曲线参数能在一定程度上解决这些问题[4-5]。然而,目标规划法和遗传算法涉及的数学计算过程或源代码编程过程较繁杂,不易被一般的工程技术人员掌握;遗传算法还可能出现“早熟”现象,不一定总能获得全局最优解[6-7]。笔者将自由搜索(Free Search,FS)算法[8]引入到水文流量关系曲线参数率定中,以期提供一种不过多依赖专业经验,但效率和精度均较高的水文流量关系曲线推求方法。
1水位流量关系曲线及其拟合准则
通常水位与流量之间呈非线性关系,当采用幂函数描述二者之间的关系时,其数学模型为[4] Q=a1Hα2 (1)
式(1)中,Q为流量(m3/s);H为水位(m);a1、a2为待定的模型参数。在求解参数a1、a2时,传统方法是先将式(1)的幂函数两边分别取对数转化为线性关系,再基于最小二乘法求出其线性关系的参数,最后经过逆变换求得原函数关系中的参数。这种基于最小二乘法的线性间接拟合方法,遵循式(2)所示的残差平方和最小准则,计算工作简便,手工即可完成,也可以借助Excel等办公软件识别参数,所以至今仍被广大水文工作者使用。
minf=pp=1(Qp-α1Ha2p)2 (2)
然而,当由最小二乘法确定式(1)参数时,虽然能够保证转换后的线性关系残差平方和最小,但并不能保证未经变换的原始非线性关系的残差平方和最小;另外,最小二乘法遵循的残差平方和最小准则突出了极端值的影响,当实测数据中存在极端值时,基于最小二乘法的拟合结果会发生严重偏差;此外,最小二乘法采用的是绝对残差,虽然考虑了绝对残差的大小,但忽视了相对残差(相对误差),而在很多情况下,相对误差也是反映模型拟合精度的重要指标[4]。因此,不能简单地认为基于最小二乘法拟合的水位流量关系曲线就是最优的拟合曲线,采用残差平方和作为拟合的准则还有待改进。
针对这些问题,黄才安[4]提出式(3)和式(4)的绝对残差绝对值和准则以及相对残差绝对值和准则,并采用目标规划方法求解了参数a1、a2,直接拟合了水位流量关系,结果表明所提出的方法拟合精度明显优于传统方法。
minf=pp=1|Qp-α1Ha2p| (3)
minf=pp=1|1-α1Ha2p/Qp| (4)
由于上述准则中的优化函数为复杂的非线性形式,还包含了绝对值运算,传统的最小二乘法已不再适用,采用非线性优化方法处理起来也比较繁琐,而且往往得不到全局最优解。FS是一种源于动物群体(animals)迁移行为的优化算法[8],动物群体凭借多次的离散运动通过搜索空间。在搜索过程中,动物个体(animal)采取探查行走的方式,目的是为了发现一个自己偏好的位置,亦即发现了实际优化问题目标函数的一个潜在解,在搜索行为结束时群体找到的最优位置即为目标函数的最优解[6-8]。因此,该研究采用FS算法拟合水位流量关系,从而率定水位流量关系曲线的参数a1、a2。
2FS在水位流量关系曲线参数率定中的应用
采用FS率定水位流量关系曲线参数时,设动物群体数量为m,则动物个体每步探查行走的位置向量对应参数的一组潜在解。第j个动物通过T步探查行走得到的位置矩阵可表示为
Aj=a1ja2jaTj=
a11ja12j
a21ja22j
aT1jaT2j (5)
式(5)中,T为探查步伐数,t=1,2,…,T;Aj为第j个动物T步探查得到的位置矩阵,j=1,2,…,m;Atj为第j个动物第t步探查时的位置向量;atij为第j个动物第t步探查时的第i维位置分量(即水位流量关系曲线的第i个参数),i=1,2,…,n,该研究中n=2。
采用随机化的初始策略,则:
a0ij=aimin+(aimax-aimin)rand(0,1) (6)
式(6)中,a0ij为第i维位置变量的初始值,即水位流量关系曲线第i个参数的初始值;aimin、aimax为第i维搜索空间的边界,即水位流量关系曲线第i个参数值变化区间;rand(0,1) 为介于[0,1]的随机数。
通过探查行走,更新动物个体位置:
atij=a0ij-Δatij+2Δatijrand(0,1) (7)
式(7)中,Δatij=Rij(aimax-aimin)rand(0,1),Rij为搜索邻域半径。
在探查行走过程中,动物个体的行为可以表示为
fij=f(atij),fj=max(fij) (8)
式(8)中,ftj为第j个动物第t步探查所得的目标函数值;fj为第j个动物t步探查过程中的最优值;信息素Ij更新为
Ij=fj/max(fi) (9)
敏感性Sj更新为
Sj=Smin+ΔSj (10)
ΔSj=(Smax-Smin)rand(0,1) (11)
式(10)(11)中,Smax为最大敏感性;Smin为最小敏感性。
Imax=Smax,Imin=Smin(12)
最后,选择和决策下一次探查行走的开始位置:
a′0ij=aij(Il≥Sj,l=1,2,…,m) (13)
式(13)中,Il为第l个动物散发的信息素。算法判断是否满足设定的终止条件,如果满足说明已经搜索到可以接受的最优解,不满足则继续探查搜索。可见,FS算法概念清晰,需要设置的参数较少,迭代计算过程简单,算法容易编程实现。
3实例应用
为与以往研究成果对比,仍采用文献[4]的某水文站13组水位流量观测数据(表1),在3种拟合准则下,采用Matlab语言编制了FS程序,设定FS动物个数m=20,探查步数T=5,迭代2 000次,率定参数后的水位流量幂函数关系分别为Q=5.787 1H1.704 3、Q= 4.304 2H1.827 4、Q=4.262 8H1.831 0,每种准则下的计算流量、绝对误差及相对误差见表1,不同准则下所得的特征值见表2。由于各文献的计算结果保留位数不同且差别较小,为便于比较分析,根据文献[4]和文献[5]提供的模型参数,重新计算了其残差平方和、平均绝对误差与平均相对误差,并保留到小数点后3位,一并列入表2中。
从表2可以看出,该研究的计算结果与文献[4]、文献[5]一致,与传统的基于最小二乘法和残差平方和最小为准则的方法相比,当以绝对残差绝对值和、相对残差绝对值和为拟合准则时,推求的水位流量关系曲线对流量实测值的拟合精度均有所提升,平均绝对误差与平均相对误差有所减小;同时也能看出,当以三准则之一率定水位流量关系曲线时,残差平方和、平均绝对误差、平均相对误差三者的增减变化并不完全同步,进一步说明传统的水位流量关系曲线推求方法存在缺陷。此外,对比该研究与文献[4]、文献[5]的研究结果还能看出,当以残差平方和、绝对残差绝对值和为拟合准则时,采用FS率定参数的水位流量关系曲线拟合精度优于目标规划法和遗传算法,所得残差平方和、平均绝对误差均为最小;当以相对残差绝对值和为拟合准则时,采用FS率定参数的水位流量关系曲线拟合精度和遗传算法相当,但优于目标规划法。
4结论
针对传统推求水位流量关系曲线方法存在精度不高、难以兼顾绝对误差和相对误差等问题,引入FS算法,以残差平方和、绝对残差绝对值和、相对残差绝对值和作为拟合准则,利用FS算法率定参数从而推求最优的水位流量关系曲线,所得目标函数的残差平方和、绝对残差绝对值和、相对残差绝对值和均小于传统方法,可以提高水位流量关系曲线的拟合精度。与目标规划法和遗传算法相比,计算过程和程序实现过程简单,不需要复杂的数学知识,也不过分依赖专业经验,且计算精度总体有所提升,为推求水位流量关系曲线的提供了一种新途径。
参考文献
[1]
魏永霞,王丽学.工程水文学[M].北京:中国水利水电出版社,2005.
[2] 雒文生,宋星原.工程水文及水利计算[M].2版.北京:中國水利水电出版社,2010.
[3] 丁涛,祝丽萍.水位流量关系曲线的率定及泥沙整编方法分析[J].能源与节能,2016 (4):12-13.
[4] 黄才安.水位流量关系回归的优化研究[J].水利水电技术,1995(10):2-5.
[5] 杨晓华,陆桂华,郦建强.自适应加速遗传算法及其在水位流量关系拟合中的应用[J].水文,2002,22(2):14-18.
[6] 王斌,张展羽,张国华,等.一种新的优化灌溉制度算法:自由搜索[J].水科学进展,2008,19(5):736-741.
[7] 王斌,张展羽,张国华,等.基于自由搜索的灌区优化配水模型研究[J].水利学报,2008,39(11):1239-1243.
[8] PENEV K,LITTLEFAIR G.Free Searcha comparative analysis [J].Information sciences,2005,172(1):173-193.
45卷26期庞红伟等利用Free Search算法推求水位流量关系曲线
关键词水位流量关系曲线;自由搜索;参数估计;最小二乘法;优化准则
中图分类号P337-3文献标识码
A文章编号0517-6611(2017)26-0179-03
Estimating Water Leveldischarge Curve by Free Search
PANG Hongwei1,WANG Bin2*,ZHU Shijiang3(1.Kaifeng Yellow River Management Office,Kaifeng,Henan 475000;2.College of Water Conservancy and Civil Engineering,Northeast Agricultural University,Harbin,Heilongjiang 150030;3.College of Hydraulic and Environmental Engineering,Three Gorges University,Yichang,Hubei 443002)
Abstract To establish the relationship between water level and discharge is an important job of hydrological data reorganization,but it is a low precision method of parameters calibration in water leveldischarge curve using least square method and minimum residual sum of square,and it is difficult to give consideration to the problems such as absolute error and relative error.In this paper,Free Search (FS),which derived from the animal group migration behavior,was used as a method for estimating water leveldischarge curves.The position vector of each exploratory step for the individual animal was ascertained as an initial water leveldischarge curve by FS.The simulation results showed that the satisfactory results could be achieved by FS for optimizing the water leveldischarge curves,and runoff simulation exhibits relatively high precision water leveldischarge compared with the goal programming method and genetic algorithm.
Key wordsWater leveldischarge curve; Free Search; Parameters estimation; Least square method; Optimization criteria
在天然河流测验断面长期开展流量测定工作比较困难。由于水位与流量关系密切,且水位随时间的变化过程易于观测,因而一般不需要连续观测流量过程,而是通过一定次数的实测水位与流量的对应资料建立水位与流量的关系曲线,再依据水位流量关系曲线,把水位变化过程转换为相应的流量变化过程,并计算出各种流量的特征值[1]。在水文站开展的流量资料整编内容虽多,但其中的核心工作就是建立水位流量关系,水位流量关系曲线法也因而成为流量资料整编中最常用、最基本的方法[2-3]。传统的水位流量关系曲线拟合方法基于最小二乘法,虽然能够得到最小的残差平方和,但求得的水位流量关系曲线不一定就是最优的拟合曲线,在拟合实测值时存在精度低等问题[4]。当采用绝对残差和、相对残差和的绝对值作为评价拟合准则,并采用目标规划法、遗传算法(Genetic Algorithm,GA)等方法率定水位流量关系曲线参数能在一定程度上解决这些问题[4-5]。然而,目标规划法和遗传算法涉及的数学计算过程或源代码编程过程较繁杂,不易被一般的工程技术人员掌握;遗传算法还可能出现“早熟”现象,不一定总能获得全局最优解[6-7]。笔者将自由搜索(Free Search,FS)算法[8]引入到水文流量关系曲线参数率定中,以期提供一种不过多依赖专业经验,但效率和精度均较高的水文流量关系曲线推求方法。
1水位流量关系曲线及其拟合准则
通常水位与流量之间呈非线性关系,当采用幂函数描述二者之间的关系时,其数学模型为[4] Q=a1Hα2 (1)
式(1)中,Q为流量(m3/s);H为水位(m);a1、a2为待定的模型参数。在求解参数a1、a2时,传统方法是先将式(1)的幂函数两边分别取对数转化为线性关系,再基于最小二乘法求出其线性关系的参数,最后经过逆变换求得原函数关系中的参数。这种基于最小二乘法的线性间接拟合方法,遵循式(2)所示的残差平方和最小准则,计算工作简便,手工即可完成,也可以借助Excel等办公软件识别参数,所以至今仍被广大水文工作者使用。
minf=pp=1(Qp-α1Ha2p)2 (2)
然而,当由最小二乘法确定式(1)参数时,虽然能够保证转换后的线性关系残差平方和最小,但并不能保证未经变换的原始非线性关系的残差平方和最小;另外,最小二乘法遵循的残差平方和最小准则突出了极端值的影响,当实测数据中存在极端值时,基于最小二乘法的拟合结果会发生严重偏差;此外,最小二乘法采用的是绝对残差,虽然考虑了绝对残差的大小,但忽视了相对残差(相对误差),而在很多情况下,相对误差也是反映模型拟合精度的重要指标[4]。因此,不能简单地认为基于最小二乘法拟合的水位流量关系曲线就是最优的拟合曲线,采用残差平方和作为拟合的准则还有待改进。
针对这些问题,黄才安[4]提出式(3)和式(4)的绝对残差绝对值和准则以及相对残差绝对值和准则,并采用目标规划方法求解了参数a1、a2,直接拟合了水位流量关系,结果表明所提出的方法拟合精度明显优于传统方法。
minf=pp=1|Qp-α1Ha2p| (3)
minf=pp=1|1-α1Ha2p/Qp| (4)
由于上述准则中的优化函数为复杂的非线性形式,还包含了绝对值运算,传统的最小二乘法已不再适用,采用非线性优化方法处理起来也比较繁琐,而且往往得不到全局最优解。FS是一种源于动物群体(animals)迁移行为的优化算法[8],动物群体凭借多次的离散运动通过搜索空间。在搜索过程中,动物个体(animal)采取探查行走的方式,目的是为了发现一个自己偏好的位置,亦即发现了实际优化问题目标函数的一个潜在解,在搜索行为结束时群体找到的最优位置即为目标函数的最优解[6-8]。因此,该研究采用FS算法拟合水位流量关系,从而率定水位流量关系曲线的参数a1、a2。
2FS在水位流量关系曲线参数率定中的应用
采用FS率定水位流量关系曲线参数时,设动物群体数量为m,则动物个体每步探查行走的位置向量对应参数的一组潜在解。第j个动物通过T步探查行走得到的位置矩阵可表示为
Aj=a1ja2jaTj=
a11ja12j
a21ja22j
aT1jaT2j (5)
式(5)中,T为探查步伐数,t=1,2,…,T;Aj为第j个动物T步探查得到的位置矩阵,j=1,2,…,m;Atj为第j个动物第t步探查时的位置向量;atij为第j个动物第t步探查时的第i维位置分量(即水位流量关系曲线的第i个参数),i=1,2,…,n,该研究中n=2。
采用随机化的初始策略,则:
a0ij=aimin+(aimax-aimin)rand(0,1) (6)
式(6)中,a0ij为第i维位置变量的初始值,即水位流量关系曲线第i个参数的初始值;aimin、aimax为第i维搜索空间的边界,即水位流量关系曲线第i个参数值变化区间;rand(0,1) 为介于[0,1]的随机数。
通过探查行走,更新动物个体位置:
atij=a0ij-Δatij+2Δatijrand(0,1) (7)
式(7)中,Δatij=Rij(aimax-aimin)rand(0,1),Rij为搜索邻域半径。
在探查行走过程中,动物个体的行为可以表示为
fij=f(atij),fj=max(fij) (8)
式(8)中,ftj为第j个动物第t步探查所得的目标函数值;fj为第j个动物t步探查过程中的最优值;信息素Ij更新为
Ij=fj/max(fi) (9)
敏感性Sj更新为
Sj=Smin+ΔSj (10)
ΔSj=(Smax-Smin)rand(0,1) (11)
式(10)(11)中,Smax为最大敏感性;Smin为最小敏感性。
Imax=Smax,Imin=Smin(12)
最后,选择和决策下一次探查行走的开始位置:
a′0ij=aij(Il≥Sj,l=1,2,…,m) (13)
式(13)中,Il为第l个动物散发的信息素。算法判断是否满足设定的终止条件,如果满足说明已经搜索到可以接受的最优解,不满足则继续探查搜索。可见,FS算法概念清晰,需要设置的参数较少,迭代计算过程简单,算法容易编程实现。
3实例应用
为与以往研究成果对比,仍采用文献[4]的某水文站13组水位流量观测数据(表1),在3种拟合准则下,采用Matlab语言编制了FS程序,设定FS动物个数m=20,探查步数T=5,迭代2 000次,率定参数后的水位流量幂函数关系分别为Q=5.787 1H1.704 3、Q= 4.304 2H1.827 4、Q=4.262 8H1.831 0,每种准则下的计算流量、绝对误差及相对误差见表1,不同准则下所得的特征值见表2。由于各文献的计算结果保留位数不同且差别较小,为便于比较分析,根据文献[4]和文献[5]提供的模型参数,重新计算了其残差平方和、平均绝对误差与平均相对误差,并保留到小数点后3位,一并列入表2中。
从表2可以看出,该研究的计算结果与文献[4]、文献[5]一致,与传统的基于最小二乘法和残差平方和最小为准则的方法相比,当以绝对残差绝对值和、相对残差绝对值和为拟合准则时,推求的水位流量关系曲线对流量实测值的拟合精度均有所提升,平均绝对误差与平均相对误差有所减小;同时也能看出,当以三准则之一率定水位流量关系曲线时,残差平方和、平均绝对误差、平均相对误差三者的增减变化并不完全同步,进一步说明传统的水位流量关系曲线推求方法存在缺陷。此外,对比该研究与文献[4]、文献[5]的研究结果还能看出,当以残差平方和、绝对残差绝对值和为拟合准则时,采用FS率定参数的水位流量关系曲线拟合精度优于目标规划法和遗传算法,所得残差平方和、平均绝对误差均为最小;当以相对残差绝对值和为拟合准则时,采用FS率定参数的水位流量关系曲线拟合精度和遗传算法相当,但优于目标规划法。
4结论
针对传统推求水位流量关系曲线方法存在精度不高、难以兼顾绝对误差和相对误差等问题,引入FS算法,以残差平方和、绝对残差绝对值和、相对残差绝对值和作为拟合准则,利用FS算法率定参数从而推求最优的水位流量关系曲线,所得目标函数的残差平方和、绝对残差绝对值和、相对残差绝对值和均小于传统方法,可以提高水位流量关系曲线的拟合精度。与目标规划法和遗传算法相比,计算过程和程序实现过程简单,不需要复杂的数学知识,也不过分依赖专业经验,且计算精度总体有所提升,为推求水位流量关系曲线的提供了一种新途径。
参考文献
[1]
魏永霞,王丽学.工程水文学[M].北京:中国水利水电出版社,2005.
[2] 雒文生,宋星原.工程水文及水利计算[M].2版.北京:中國水利水电出版社,2010.
[3] 丁涛,祝丽萍.水位流量关系曲线的率定及泥沙整编方法分析[J].能源与节能,2016 (4):12-13.
[4] 黄才安.水位流量关系回归的优化研究[J].水利水电技术,1995(10):2-5.
[5] 杨晓华,陆桂华,郦建强.自适应加速遗传算法及其在水位流量关系拟合中的应用[J].水文,2002,22(2):14-18.
[6] 王斌,张展羽,张国华,等.一种新的优化灌溉制度算法:自由搜索[J].水科学进展,2008,19(5):736-741.
[7] 王斌,张展羽,张国华,等.基于自由搜索的灌区优化配水模型研究[J].水利学报,2008,39(11):1239-1243.
[8] PENEV K,LITTLEFAIR G.Free Searcha comparative analysis [J].Information sciences,2005,172(1):173-193.
45卷26期庞红伟等利用Free Search算法推求水位流量关系曲线