论文部分内容阅读
摘要:介绍了偏最小乘法回归基本原理和建模思路,采用最小二乘法进行回归建模分析,将偏最小二乘法回归应用于水利工程安全监测数据分析,通过将模型拟合与非模型式的数据内涵分析有机结合确保了模型分析的精度。在選取的绕坝渗流地下水位实测数据建模案例中,采用偏最小二乘回归法具备对实测结果更合理的成因解释能力,且该模型同时保证了较高的精度,能够很好地应用于水利安全监测及数据统计分析当中。
关键词:偏最小二乘;建模;水利工程;安全监测
Abstract: the article introduces the partial least square principle and modeling regression ideas, the least square method regression analysis model, the partial least squares regression used in water conservancy project safety monitoring data analysis, the model fitting with the model of data analysis of the connotation of organic combination ensures that the model analysis precision. The dam seepage in the underground water level measured data modeling case, the partial least-squares regression of measured results have more reasonable cause explain ability, and the model and assure the high precision, and can be used in water conservancy safety monitoring and data of statistical analysis.
Keywords: partial least squares; Modeling; Water conservancy projects; Safety monitoring
中图分类号:TV文献标识码:A 文章编号:
基于水资源战略和基础农业保障的考虑,目前世界各国对水利工程建设掀起了一股新的高潮,而在这些水利工程建设中,巨型堤坝工程不断涌现,如三峡大坝、雅鲁藏布江峡谷的水坝,这些巨型水坝在抬高施工难度的同时,也带来了日益复杂化的技术挑战。对这些极端复杂的堤坝的地基的位移变形、应力应变和渗流等堤坝常见问题的安全监测成了施工和后续管理中的难题。而目前水利工程界普遍采用函数法对采集到的监测数据进行分析处理,从而宏观判断工程实际安全性和存在的隐患险情,为预防和加固提供参考,从而确保施工和长久安全运行打下基础。然而由于工程庞大带来的数据的巨量与变量增多,使得对工程安全监测的精度带来的挑战,这也成了工程界的一大难题。本文介绍的偏最小二乘法(PLSR)[1]作为一种新型的多元统计分析法能够有效解决常规最小二乘回归难以克服的自变量因子多种相关性影响及难以识别难题而逐渐水利工程安全监测中得到广泛应用。为此本文对PLSR建模法在工程安全监测中的应用进行了探讨。
1、偏最小二乘回归法及其基本思想
偏最小二乘回归是一种新型的多元统计数据分析方法,它集多元线性回归分析、 典型相关分析和主成分分析的基本功能于一体,将建模预测类型的数据分析方法与非模式的数据认识性分析方法有机地结合在一起,能够在自变量存在严重相关性的条件下进行回归建模。 较之最小二乘回归,偏最小二乘回归模型更易于辨识系统信息与噪声,每一个自变量的回归系数更容易解释,因此其结果也更加精确可靠。
PLSR基本思路是,设有单变量y和p个自变量 ,工程观测点设为n个,据此搭建了自变量与因变量的数据表X=,x1,x2,x3…,x𝑝.n*p和Y= 。那么,偏最小二乘回归分别在X和Y中提取成分t1和u1。在第一个成分t1和 u1被提取后,偏最小二乘回归分别实施X 对t1的回归以及 Y 对t1 的回归。如果回归方程已经达到满意的精度,则函数计算终止;否则将利用X 被t1解释后的残余信息进行第二轮的成分提取。如此往复直到能达到一个较满意的精度为止。
2、水利工程安全监测PLSR建模思路及关键因子介绍
大型水利工程往往涉及巨型坝基、地面大坝、泄洪道、排沙区和引水发电等建筑设施以及上下游库区的边坡、滑坡体的安全状态,在以上敏感地段安装检测仪器对有关流体变形、地面渗流及建筑物应力应变等实测数据进行精确分析来综合判断建筑和周边地质安全性是水利工程安全监测思路。而利用PLSR建模思路来进行水利安全监测,其思路就是巧妙利用PLSR基本思路构建可以得到该精度、拟合和预测性能均相对较好的PLSR模型[2]。
2.1 PLSR模型精度分析
PLSR模型精度可通过评价t1,t2,t3……tm对X和Y解释能力来判断。其中t1,t2,t3……tm对X的解释能力计算公式为:
R2X=;
t1,t2,t3……tm对Y的解释能力计算公式为:
R2Y=.
R2X和 R2Y均≤1,其值越高(越接近临界线S=1) ,表明所提取的成分t1,t2, …,tm 对X 和Y 的解释能力越强,也即是说所建模型的精度越高。
2.2 自变量因子重要程度分析
自变量因子对因变量的解释能力越强,其重要性越大。从PLSR 建模过程可知, 若所提取的成分th 对Y 的解释能力很强,而自变量因子xj 在构造th 时又起到了极为关键的辅助作用,则x j 对Y 的解释能力就很大。
3、结语
主要目的是研究偏最小二乘方法在水利工程安全监测中建立回归模型的突出优势。通过以上分析, 证明了偏最小二乘方法能很好地应用于水利工程安全测算,并具有如下特点:
3.1PLSR法能够有效消弭因子间的多重相关性影响,有效分离所见模型因子,从而合理、符合实际地对实测因变量做出物理成因解释。
3.2PLSR分析法用于拟合工程安全监测能使自变量和因变量之间的相关关系取到最大值, 所获得的模型拟合和预测精度较高。
3.3 PLSR法搭建的模型,其结构符合水利工程安全监测要求,计算结果较为精确可靠。
参考文献:
[1]王慧文.偏最小二乘回归方法及其应用[M].北京:国防工业出版社,1999.
[2]Palyulin V A,Radchenko E V,Baranova D,et al.MFTA:Recent Extensions of Molecular Field To pology Analysis: processes,problems and solutions [M].Black-well Publishing.Bournemouth UK,2003(13),188- 190.
[3]Georges R,Darbre. Probabilistic safety assessment of dams[A]. Papers of the 20th International Congress on Large Dams[C].Beijing: China,2000 (76),185- 195.
[4]秦蓓蕾,王文圣.偏最小二乘回归模型在水文相关分析中的应用[J].四川大学学报.2007(35),115-118.
[5]Eriksson L,Joha nsson E,Kettaneh W N,et al.Multipleand megavariate data analysis Principles and applications[M].Umea:Umetrics, 2007(13),131-135.
作者简介:韩伟丽(1983.10--),女,河北省平山人,本科 ,助理工程师,河北省岗南水库管理局。
注:文章内所有公式及图表请用PDF形式查看。
关键词:偏最小二乘;建模;水利工程;安全监测
Abstract: the article introduces the partial least square principle and modeling regression ideas, the least square method regression analysis model, the partial least squares regression used in water conservancy project safety monitoring data analysis, the model fitting with the model of data analysis of the connotation of organic combination ensures that the model analysis precision. The dam seepage in the underground water level measured data modeling case, the partial least-squares regression of measured results have more reasonable cause explain ability, and the model and assure the high precision, and can be used in water conservancy safety monitoring and data of statistical analysis.
Keywords: partial least squares; Modeling; Water conservancy projects; Safety monitoring
中图分类号:TV文献标识码:A 文章编号:
基于水资源战略和基础农业保障的考虑,目前世界各国对水利工程建设掀起了一股新的高潮,而在这些水利工程建设中,巨型堤坝工程不断涌现,如三峡大坝、雅鲁藏布江峡谷的水坝,这些巨型水坝在抬高施工难度的同时,也带来了日益复杂化的技术挑战。对这些极端复杂的堤坝的地基的位移变形、应力应变和渗流等堤坝常见问题的安全监测成了施工和后续管理中的难题。而目前水利工程界普遍采用函数法对采集到的监测数据进行分析处理,从而宏观判断工程实际安全性和存在的隐患险情,为预防和加固提供参考,从而确保施工和长久安全运行打下基础。然而由于工程庞大带来的数据的巨量与变量增多,使得对工程安全监测的精度带来的挑战,这也成了工程界的一大难题。本文介绍的偏最小二乘法(PLSR)[1]作为一种新型的多元统计分析法能够有效解决常规最小二乘回归难以克服的自变量因子多种相关性影响及难以识别难题而逐渐水利工程安全监测中得到广泛应用。为此本文对PLSR建模法在工程安全监测中的应用进行了探讨。
1、偏最小二乘回归法及其基本思想
偏最小二乘回归是一种新型的多元统计数据分析方法,它集多元线性回归分析、 典型相关分析和主成分分析的基本功能于一体,将建模预测类型的数据分析方法与非模式的数据认识性分析方法有机地结合在一起,能够在自变量存在严重相关性的条件下进行回归建模。 较之最小二乘回归,偏最小二乘回归模型更易于辨识系统信息与噪声,每一个自变量的回归系数更容易解释,因此其结果也更加精确可靠。
PLSR基本思路是,设有单变量y和p个自变量 ,工程观测点设为n个,据此搭建了自变量与因变量的数据表X=,x1,x2,x3…,x𝑝.n*p和Y= 。那么,偏最小二乘回归分别在X和Y中提取成分t1和u1。在第一个成分t1和 u1被提取后,偏最小二乘回归分别实施X 对t1的回归以及 Y 对t1 的回归。如果回归方程已经达到满意的精度,则函数计算终止;否则将利用X 被t1解释后的残余信息进行第二轮的成分提取。如此往复直到能达到一个较满意的精度为止。
2、水利工程安全监测PLSR建模思路及关键因子介绍
大型水利工程往往涉及巨型坝基、地面大坝、泄洪道、排沙区和引水发电等建筑设施以及上下游库区的边坡、滑坡体的安全状态,在以上敏感地段安装检测仪器对有关流体变形、地面渗流及建筑物应力应变等实测数据进行精确分析来综合判断建筑和周边地质安全性是水利工程安全监测思路。而利用PLSR建模思路来进行水利安全监测,其思路就是巧妙利用PLSR基本思路构建可以得到该精度、拟合和预测性能均相对较好的PLSR模型[2]。
2.1 PLSR模型精度分析
PLSR模型精度可通过评价t1,t2,t3……tm对X和Y解释能力来判断。其中t1,t2,t3……tm对X的解释能力计算公式为:
R2X=;
t1,t2,t3……tm对Y的解释能力计算公式为:
R2Y=.
R2X和 R2Y均≤1,其值越高(越接近临界线S=1) ,表明所提取的成分t1,t2, …,tm 对X 和Y 的解释能力越强,也即是说所建模型的精度越高。
2.2 自变量因子重要程度分析
自变量因子对因变量的解释能力越强,其重要性越大。从PLSR 建模过程可知, 若所提取的成分th 对Y 的解释能力很强,而自变量因子xj 在构造th 时又起到了极为关键的辅助作用,则x j 对Y 的解释能力就很大。
3、结语
主要目的是研究偏最小二乘方法在水利工程安全监测中建立回归模型的突出优势。通过以上分析, 证明了偏最小二乘方法能很好地应用于水利工程安全测算,并具有如下特点:
3.1PLSR法能够有效消弭因子间的多重相关性影响,有效分离所见模型因子,从而合理、符合实际地对实测因变量做出物理成因解释。
3.2PLSR分析法用于拟合工程安全监测能使自变量和因变量之间的相关关系取到最大值, 所获得的模型拟合和预测精度较高。
3.3 PLSR法搭建的模型,其结构符合水利工程安全监测要求,计算结果较为精确可靠。
参考文献:
[1]王慧文.偏最小二乘回归方法及其应用[M].北京:国防工业出版社,1999.
[2]Palyulin V A,Radchenko E V,Baranova D,et al.MFTA:Recent Extensions of Molecular Field To pology Analysis: processes,problems and solutions [M].Black-well Publishing.Bournemouth UK,2003(13),188- 190.
[3]Georges R,Darbre. Probabilistic safety assessment of dams[A]. Papers of the 20th International Congress on Large Dams[C].Beijing: China,2000 (76),185- 195.
[4]秦蓓蕾,王文圣.偏最小二乘回归模型在水文相关分析中的应用[J].四川大学学报.2007(35),115-118.
[5]Eriksson L,Joha nsson E,Kettaneh W N,et al.Multipleand megavariate data analysis Principles and applications[M].Umea:Umetrics, 2007(13),131-135.
作者简介:韩伟丽(1983.10--),女,河北省平山人,本科 ,助理工程师,河北省岗南水库管理局。
注:文章内所有公式及图表请用PDF形式查看。