论文部分内容阅读
摘 要:在水质评价中,多元统计分析为一种有效且简便的分析方法。本文运用多元统计方法对某河水质时空变化情况展开研究,以期为河水资源保护、利用等提供参考与依据。
关键词:多元统计方法 水质时空变化 应用
伴随社会经济的持续发展,河流污染问题越发严重与突出。河流水质除了受自然因素(如大气沉降、降水等)影响之外,还有诸多人为因素,如农田地表径流、城市废水等。因此,需对河流系统开展长期性检测与评估,从中获取有用、可靠信息,防控河流污染。由于河流具有区域性、季节性等特点,通过对河流水质的时空变化特征进行研究,能为有效管理水环境提供所需的动态信息。多元统计方法作为一种用于水质时空变化研究及污染源识别的有效方法,已被广泛应用于实践中。本文对多元统计方法在河水质时空变化分析中的应用作一探讨。
一、研究区概况
研究区位于某省南部,地处某河流域。某河为汉江一直流,河道长度为86km,上下游落差为2580m,流域面积729k㎡,某河位于某自然保护区境内,有着较好的整体生态环境,且为区域内动植物提供了不错的栖息环境,水质优;下游因存在人类活动,因而有轻度污染。金水河实为一条季节性河流,所以,依据平水期(5月、11月)、枯水期(12月-次年3月)、丰水期(7月~10月)进行采样。依据某河地理环境总体特点,共确定采样点12处,即汉江汇流处(S12)、黄金峡河口(S11)、牛角坝(S8)、栗子坝(S6)、庙坝村(S4)、大称號(S1)、金水镇(S10)、牛角坝(S8)、女儿坝村(S5)、白庙子(S3)、岳坝(S2),共进行了5次采样的数据整理与实验室分析。
二、研究方法
(1)系统聚类分析法(HCA)。此方法作为一种探索性方法,已得到广泛应用;其有两种划分,即样品聚类(Q型聚类)与变量聚类(R型聚类)。本质而言,即依据样品间亲疏关系或变量,利用逐次聚合方法,结合性质相近的对象,使之形成一类。在水质评价过程中,通常依据采样点与采样时间完成聚类,然后对水质的时空变化特征展开分析;或依据评价指标来聚类,对指标间相似性展开分析。本次研究用组间欧氏距离法,用HCA系统化分析该河水质的时空相似性。(2)因子分析法(FA)。针对FA而言,其除了能降低变量维数之外,还能将变量分类。其本质即为从各种实测原变量当中,提取抽象的、彼此不相关的综合指标,也就是因子,各原变量均能用所提取的共因子的线性组合来表示;此外,依据各因子对原变量所产生的影响情况,还能把原变量分成与因子数目相等的类数。在水质分析过程中,此方法多用于污染源的识别以及污染因子的提取。
三、数据来源及预处理
本次研究选用的是2016年~2017年的数据,即对12个采样点5次的检测值。因指标具有连续性与代表性,取其中12个指标开展统计分析,见表1。
四、分析结果
1.时空聚类分析。依据欧氏距离及时间尺度的聚类分析,把5次采样时间进行分组,第1组为干旱,包含2016年12月及2017年3月与5月,前者属于平水期,后者为枯水期;第2组为雨季,包含2016年10月、2017年8月,属丰水期。从最终结果可知,该河水质不仅受制于水文条件,而且还有显著的季节性变化。此外,第2组的划分吻合于丰水期,而第1组的划分存在偏差,未深入区分平水期与枯水期。所以,在后续水质检测过程中,需依据实际情况,酌情增加平水期、枯水期的采样频次,以此来最大化提升检测质量。结合采样点地理位置所具有的差异性与相似性,将空间尺度的聚类分析进行分组,即2组或3组。若依据2组来划分,第1组包含S11与S1~S9,第2组包含S12与S10,若依据3组来分化,还可以将第1组分为2组,即一组为S1~S8,另一组为S9、S11。依据水质污染程度,本次研究按照3组来划分并讨论。第1组处于该河上游,人烟稀少,交通不变,有着较好的自然水质状态;第2组位于该河中游,有人类活动,水质有一定污染;S11位于该河末端,人口少,地质险要,电能因其与上游来水相承接,水质有污染。第3组S10地处某镇,人口多,但无工业活动,污染物多为生活污水。S11为第2组,表明该河在经过S10后,自净能力强,能一定程度恢复外界干扰。
2.因子分析。依据特征值>1原则,在空间因子分析过程中,提取公因子3个,分别为F1、F2、F3,它们贡献率共85.65%,认可能将原始数据对应的基本信息反映出来。F1贡献率54.56%,其中,占因子载荷比较大的是Ca、Mg、PO4-P、NO3-N、HCO3,且与F1之间呈现正相关,可代表水体的硬度、离子水平。F2贡献率为21.68%,因子载荷较高的是NH3-N、K、NH4-N、Temp等,其与F2呈现明显的正相关,代表的是水体含氮水平。因子得分可反映出各采样点的实际污染情况,分值越高,表明水质就越差。处于河流下游的金水镇,具有最高的因子综合得分,因而其污染也是最严重的,位于上游地区大称号综合得分最低,表明其水质最好。此结果表明水质具有显著的空间分异特征。金水镇地处该河流下游,人口多,有着较高的土地利用程度,生活污水、农田地表径流污染着河流水质;而大称号低处上游,有着较高的植被覆盖率,人口较少,因而对河流水质具有较小影响。
五、结语
综上,可得出如下结论:(1)通过时间聚类分析,把采样时间分成2组,分别与雨季、干季对应,表明该河存在十分明显的季节性变化;而通过空间聚类分析,将采样点划分为3类,表明各采样点有着差异性的污染程度与水质水平。(2)在因子分析当中,从各因素当中分别提取3个公因子,将之分别代表水体的含磷水平、含氮水平、离子朔评;从最终因子得分结果可知,污染最为严重的是金水镇,有着最差的水质,而拥有最好水质的是大称号。
参考文献:
[1]王刚,李兆富,万荣荣,等.基于多元统计分析方法的西苕溪流域水质时空变化研究[J].农业环境科学学报,2015,34(9):1797-1803.
[2]徐华山,徐宗学,唐芳芳,等.漳卫南运河流域水质时空变化特征及其污染源识别[J].环境科学, 2012, 33(2):359-369.
[3]许伟河,杨宇俊.多元统计中的预测问题[J].闽江学院学报,2004, 25(5):11-13.
作者简介:马健悦(1997.04—)女。民族:汉。籍贯:河北省张家口市。职务:学生。学历:大学本科。研究方向:经济统计学。
关键词:多元统计方法 水质时空变化 应用
伴随社会经济的持续发展,河流污染问题越发严重与突出。河流水质除了受自然因素(如大气沉降、降水等)影响之外,还有诸多人为因素,如农田地表径流、城市废水等。因此,需对河流系统开展长期性检测与评估,从中获取有用、可靠信息,防控河流污染。由于河流具有区域性、季节性等特点,通过对河流水质的时空变化特征进行研究,能为有效管理水环境提供所需的动态信息。多元统计方法作为一种用于水质时空变化研究及污染源识别的有效方法,已被广泛应用于实践中。本文对多元统计方法在河水质时空变化分析中的应用作一探讨。
一、研究区概况
研究区位于某省南部,地处某河流域。某河为汉江一直流,河道长度为86km,上下游落差为2580m,流域面积729k㎡,某河位于某自然保护区境内,有着较好的整体生态环境,且为区域内动植物提供了不错的栖息环境,水质优;下游因存在人类活动,因而有轻度污染。金水河实为一条季节性河流,所以,依据平水期(5月、11月)、枯水期(12月-次年3月)、丰水期(7月~10月)进行采样。依据某河地理环境总体特点,共确定采样点12处,即汉江汇流处(S12)、黄金峡河口(S11)、牛角坝(S8)、栗子坝(S6)、庙坝村(S4)、大称號(S1)、金水镇(S10)、牛角坝(S8)、女儿坝村(S5)、白庙子(S3)、岳坝(S2),共进行了5次采样的数据整理与实验室分析。
二、研究方法
(1)系统聚类分析法(HCA)。此方法作为一种探索性方法,已得到广泛应用;其有两种划分,即样品聚类(Q型聚类)与变量聚类(R型聚类)。本质而言,即依据样品间亲疏关系或变量,利用逐次聚合方法,结合性质相近的对象,使之形成一类。在水质评价过程中,通常依据采样点与采样时间完成聚类,然后对水质的时空变化特征展开分析;或依据评价指标来聚类,对指标间相似性展开分析。本次研究用组间欧氏距离法,用HCA系统化分析该河水质的时空相似性。(2)因子分析法(FA)。针对FA而言,其除了能降低变量维数之外,还能将变量分类。其本质即为从各种实测原变量当中,提取抽象的、彼此不相关的综合指标,也就是因子,各原变量均能用所提取的共因子的线性组合来表示;此外,依据各因子对原变量所产生的影响情况,还能把原变量分成与因子数目相等的类数。在水质分析过程中,此方法多用于污染源的识别以及污染因子的提取。
三、数据来源及预处理
本次研究选用的是2016年~2017年的数据,即对12个采样点5次的检测值。因指标具有连续性与代表性,取其中12个指标开展统计分析,见表1。
四、分析结果
1.时空聚类分析。依据欧氏距离及时间尺度的聚类分析,把5次采样时间进行分组,第1组为干旱,包含2016年12月及2017年3月与5月,前者属于平水期,后者为枯水期;第2组为雨季,包含2016年10月、2017年8月,属丰水期。从最终结果可知,该河水质不仅受制于水文条件,而且还有显著的季节性变化。此外,第2组的划分吻合于丰水期,而第1组的划分存在偏差,未深入区分平水期与枯水期。所以,在后续水质检测过程中,需依据实际情况,酌情增加平水期、枯水期的采样频次,以此来最大化提升检测质量。结合采样点地理位置所具有的差异性与相似性,将空间尺度的聚类分析进行分组,即2组或3组。若依据2组来划分,第1组包含S11与S1~S9,第2组包含S12与S10,若依据3组来分化,还可以将第1组分为2组,即一组为S1~S8,另一组为S9、S11。依据水质污染程度,本次研究按照3组来划分并讨论。第1组处于该河上游,人烟稀少,交通不变,有着较好的自然水质状态;第2组位于该河中游,有人类活动,水质有一定污染;S11位于该河末端,人口少,地质险要,电能因其与上游来水相承接,水质有污染。第3组S10地处某镇,人口多,但无工业活动,污染物多为生活污水。S11为第2组,表明该河在经过S10后,自净能力强,能一定程度恢复外界干扰。
2.因子分析。依据特征值>1原则,在空间因子分析过程中,提取公因子3个,分别为F1、F2、F3,它们贡献率共85.65%,认可能将原始数据对应的基本信息反映出来。F1贡献率54.56%,其中,占因子载荷比较大的是Ca、Mg、PO4-P、NO3-N、HCO3,且与F1之间呈现正相关,可代表水体的硬度、离子水平。F2贡献率为21.68%,因子载荷较高的是NH3-N、K、NH4-N、Temp等,其与F2呈现明显的正相关,代表的是水体含氮水平。因子得分可反映出各采样点的实际污染情况,分值越高,表明水质就越差。处于河流下游的金水镇,具有最高的因子综合得分,因而其污染也是最严重的,位于上游地区大称号综合得分最低,表明其水质最好。此结果表明水质具有显著的空间分异特征。金水镇地处该河流下游,人口多,有着较高的土地利用程度,生活污水、农田地表径流污染着河流水质;而大称号低处上游,有着较高的植被覆盖率,人口较少,因而对河流水质具有较小影响。
五、结语
综上,可得出如下结论:(1)通过时间聚类分析,把采样时间分成2组,分别与雨季、干季对应,表明该河存在十分明显的季节性变化;而通过空间聚类分析,将采样点划分为3类,表明各采样点有着差异性的污染程度与水质水平。(2)在因子分析当中,从各因素当中分别提取3个公因子,将之分别代表水体的含磷水平、含氮水平、离子朔评;从最终因子得分结果可知,污染最为严重的是金水镇,有着最差的水质,而拥有最好水质的是大称号。
参考文献:
[1]王刚,李兆富,万荣荣,等.基于多元统计分析方法的西苕溪流域水质时空变化研究[J].农业环境科学学报,2015,34(9):1797-1803.
[2]徐华山,徐宗学,唐芳芳,等.漳卫南运河流域水质时空变化特征及其污染源识别[J].环境科学, 2012, 33(2):359-369.
[3]许伟河,杨宇俊.多元统计中的预测问题[J].闽江学院学报,2004, 25(5):11-13.
作者简介:马健悦(1997.04—)女。民族:汉。籍贯:河北省张家口市。职务:学生。学历:大学本科。研究方向:经济统计学。