论文部分内容阅读
摘 要:水环境精细化管理对水资源质量评价的精度和时效性提出了更高要求。我国在长期水环境监测体系建设过程中积累了大量数据,迫切需要研究建立基于多源监测与数据融合的水质动态评价关键技术。系统论述了实施水质动态评价的支撑条件,总结了数据有效利用方面存在的数据孤岛现象较明显、数据共享不畅通、数据有机融合不充分等不足,梳理了多源数据融合的加权平均法、卡尔曼滤波、D-S证据理论、粗糙集理论等主要技术方法,分类综述了地面数据融合、地空数据融合、多源遥感数据融合等多源数据融合技术在水质监测评价领域的研究现状和应用前景,并提出了相关对策建议。
关键词:多源数据;数据融合;水质监测;水质评价;水质预测;预警
Abstract:The precision and time-effectiveness of water quality evaluation are required by the delicacy management of water environment. China has accumulated a large amount of data in the long-term construction of the water environment monitoring system, so it is urgent to study and establish key technologies for dynamic water quality evaluation based on multi-source monitoring and data fusion. This paper systematically discussed the supporting conditions for the implementation of dynamic water quality evaluation and summarized the deficiencies in the effective use of data, such as obvious data island phenomenon, blocked data sharing and insufficient data fusion. Then we sorted out the main techniques and methods of multi-source data fusion, e.g., Weighted Average Method, Kalman Filter, Dempster-Shafer Evidence Theory and Rough Set Theory. Moreover, we reviewed the research status and application prospect of multi-source data fusion technology in the field of water quality monitoring and evaluation by categories (i.e., ground data fusion, ground-space data fusion and multi-source remote sensing data fusion) and finally put forward relevant countermeasures and suggestions.
Key words: multisource data; data fusion; water quality monitoring; water quality evaluation; water quality prediction; early warning
當前我国水环境质量状况不容乐观,水环境污染已成为新时期水安全保障面临的主要问题之一。过去简单、粗放式的水环境管理模式已难以满足现阶段水环境治理与保护的迫切需要,水环境精细化管理成为我国水环境管理发展的必然趋势[1]。地表水资源质量评价一般简称水质评价,是根据地表水资源开发利用和保护要求,参考国家和有关部门制定的各类水质标准,对地表水水质状况进行的评价[2]。水质评价是水环境管理的重要环节,通过对采集到的数据进行水质评价可以掌握当前水体水质状况,预测未来水质变化趋势,从而为水资源合理利用、优化配置和节约保护,以及水污染防治等决策工作提供科学支撑。
当前,流域及区域地表水水质评价工作主要是在年尺度上进行的。在我国持续推进水环境精细化管理的背景下,传统水质评价方法在时效性上存在一定短板,因缺乏对未来情势的分析研判,难以支撑水质动态、精细和科学管理需求。信息技术的发展为提高水质评价的时效性和预测预警能力提供了可能条件。为与新兴水质监测手段和数据获取方式相协调,迫切需要研究建立突破时空尺度局限性的水质动态评价关键技术。
1 实施水质动态评价的支撑条件与不足
1.1 支撑条件
(1)有关政策引领。2011年中央一号文件明确要求“加强水量水质监测能力建设,为强化监督考核提供技术支撑”。2012年,国务院《关于实行最严格水资源管理制度的意见》提出将“健全水资源监控体系”作为实行最严格水资源管理制度的重要保障措施[3]。近年来,水利部、生态环境部等有关部门在加强水资源、水环境、水生态监测体系建设过程中开展了一系列相关工作,在提高监测覆盖范围、监测频次、自动化程度等方面进行了大量有益探索。随着监测站网的不断完善以及监测技术手段的不断革新,积累了大量多来源、多尺度、多类型的水环境监测数据。为深入贯彻落实党中央提出的“国家大数据战略”、国务院印发的《促进大数据发展行动纲要》等系列决策部署,2016年,原环境保护部发布了《生态环境大数据建设总体方案》,要求把大数据技术作为推进环境治理体系和治理能力现代化的重要手段,实现生态环境综合决策科学化、生态环境监管精准化、生态环境公共服务便民化。2017年,水利部印发《关于推进水利大数据发展的指导意见》,旨在推进水利行业数据资源共享开放,促进水利大数据发展与创新应用,其中明确提出应用现代化信息技术增强水环境监测监管能力是一项重点任务。 (2)水质监测技术发展。水质监测是水质评价的基础。水质监测的传统方式是专业人员野外取样后送到实验室进行水质项目分析化验,这种方式监测项目全面、分析结果较为准确,但耗时长、成本高,且受自然、气候、水文等条件限制,难以长时间、大范围、高频次地跟踪监测。随着科技迅猛发展,各类水质监测新兴技术纷纷涌现。自动在线监测是把传感器和自动化分析仪组合起来,配套先进的控制芯片、网络通信和专业分析软件,实现从水样采集、分析到传输、处理以及存储整个过程的高度自动化[4]。自动在线监测方法信息获取及时、预警能力强,但监测项目少、仪器设备维护成本较高,且受仪器影响易出现数据异常现象。遥感监测是利用水体污染物在特定波长范围对光吸收和反射特性的差异,通过遥感影像光谱特征识别污染物种类、范围和浓度的技术[5]。遥感监测方法具有覆盖范围广、信息量大、效率高、成本低等优点,但监测项目少、精度偏低、适用性较差。此外,无人机、无人船等通过搭载高光谱传感器和水质参数分析仪对水体进行监测,从而实时监控和掌握水体水质的动态信息,为水质监测提供了新的途径[6]。总体而言,鉴于对水质监测数据准确性和可靠性的要求,现阶段水质评价工作中仍以人工采样数据为主,自动在线监测数据主要用于预报预警,卫星遥感解译监测数据的应用还处于研究探索阶段。
1.2 不足之处
尽管我国在长期水环境监测体系建设过程中积累了大量数据,但在数据有效利用方面存在不足,主要表现在以下几方面。
(1)数据孤岛现象较明显。水环境监测多是根据某一特定需求(如最严格水资源管理制度考核工作)开展的,并未将已获得数据应用于其他有关工作。这就造成本应紧密联系、相互配合的数据之间缺乏互通性,无法通过数据融合与挖掘获取更有效、更全面的信息,不能为水环境全局管理提供多角度、多层面的信息服务。因不同目的重复监测同一对象,也会增加不必要的人力、物力成本。
(2)数据共享不畅通。水环境数据长期以来分布在水利、环保、住建等部门,由于部门壁垒存在,因此数据共享存在固有困难,加之不同部门数据量、数据格式、存储方式等均有较大差别,缺乏统一的数据标准和共享要求等,使得水环境数据共享渠道不畅通。
(3)数据有机融合不充分。不同监测手段获取的数据缺乏统一的数据审核规则和技术体系,水质项目分析方法也存在差别,使有机融合存在一定困难。现阶段多源数据融合多是数据的叠加和汇总,实质性融合较少,尚未充分发挥多源数据之间的优势互补作用。
2 多源数据融合方法
通过不同监测手段获取的数据既有相关性也有异构性,并且难免存在不一致甚至矛盾之处。传统数据处理方法在处理这类数据时具有一定局限性,为克服这一问题,多源数据融合理论应运而生。多源数据融合涉及多学科知识,不同学科对这一概念的定义有所不同,从广义上来讲,是指对多个来源的数据通过识别、关联、估计、优化组合等方式进行处理,消除数据在时空维度上的冗余性、互斥性和不确定性,最终形成较单一数据来源更精细、更准确、更可靠的统一表达的过程[7-8]。数据是信息的载体,对信息的自动分析过程也是数据处理的过程,多源数据融合也称多源信息融合(Multi-Source Information Fusion)、多传感器信息融合(Multi-Sensor Data Fusion)等。Khaleghi等[7]认为,数据融合技术面临的主要挑战源于输入数据的缺陷性、相关性、不连续性和差异性,这也是数据融合算法研究需要攻克的主要问题,见图1。
多源数据融合技术自20世纪70年代末兴起,随着信息技术的发展,新理论、新技术和新方法层出不穷,多源数据融合技术广泛应用于不同领域[9]。根据融合层次、算法概念、操作原理、发展脉络等特征可以将数据融合技术方法划分为不同类型[10-12],见图2。
(1)加权平均法。加权平均法是最简单、最实用的数据融合方法。当多个传感器对同一个参数进行测量时,数据融合时一般可以采用加权平均法。该方法的融合效果主要取决于权重分配。在已知传感器精度的条件下,采用多元统计理论可以推导出多传感器数据融合的最优权重[13]。
(2)卡尔曼滤波。卡尔曼滤波是目前应用最广泛的状态估计算法。该方法的基本思想是,以最小均方误差为最佳估计准则,利用前一时刻的估计值和当前时刻的观测值更新对状态变量的估计,通过循环递归来实现状态预估和测量更新的拟合校验,从而对监测数据误差进行滤波处理[14]。卡尔曼滤波可以实时快速处理大量动态数据,常用于不同来源观测数据和数值模拟模型结果的融合[15],通过修正数值模拟运行轨迹,提高模拟精度。但在实际应用中,可能因模型的不确定性、干扰信号统计特性不完全已知等因素导致算法误差增大。
(3)D-S证据理论。D-S证据理论是一种处理不确定性推理问题的数学方法。其基本原理是将多源数据视为各个证据,利用Dempster组合规则进行证据组合,并计算各个证据和证据组合后的基本可信度分配函数、信任度函数和似然函数,最后根据一定的目标判定原则选择证据联合作用下支持度最大的假设,从而实现数据融合和决策选择[16]。D-S证据理论技术成熟、应用广泛,是贝叶斯理论的广义扩展,但比贝叶斯理论对先验知识的要求低,因而在处理不确定性问题时更为简单灵活[17]。缺点在于不能有效处理矛盾数据,当证据间存在冲突时可能出现异常甚至错误结果,此外,隨着数据和推理步数增加计算量呈幂指数增长,导致计算量爆炸。
(4)粗糙集理论。粗糙集理论主要用于对不精确、不完备、模糊数据进行归纳学习从而发现隐含知识,目前已广泛应用于多指标综合评价。其主要思想是首先利用属性约简原理删除冗余指标,然后基于简化后的信息表进行规则提取,进而完成知识库的构建[18]。粗糙集理论可以较好地解决时间序列数据中可能存在的时间不连续现象,消除数据冲突、约简数据,减少后续数据处理的工作量,同时最大限度地保留原始数据信息。该方法优点在于客观性较强,无须先验知识,允许同时使用定性和定量数据,缺点是错误判断的决定性机制简单,可能导致提取的决策规则不稳定。 (5)人工神经网络。人工神经网络近年来在多源数据融合研究领域发展迅速。人工神经网络是以网络拓扑知识为理论基础,模拟人脑神经系统对复杂信息处理机制的一种数学模型。该方法具有较强的自学习性、自组织性和良好的适应性、容错性,其非线性映射能力能拟合任意复杂的非线性函数。目前应用最广泛且较成功的人工神经网络模型是BP神经网络模型[19]。BP神经网络模型拓扑结构包括输入层、隐含层和输出层,运算包括信息的正向传播和误差的反向传播两部分,基本原理是利用梯度下降法求解使误差函数最小的网络权重最优值[20]。BP神经网络模型各层神经元个数和隐含层层数选取对于模型训练时间和稳定性有较大影响。
(6)支持向量机。支持向量机是在统计学习理论基础上发展起来的机器学习方法,是一种按监督学习来对数据进行二分类的广义线性分类器。支持向量机在非线性模式识别上的优良性能使其在分类评价工作中广泛应用。其基本原理是通过非线性变换将训练集样本映射到高维特征空间,并在高维特征空间中寻找一个最优分类超平面使训练集中的点距离分类面尽可能远,从而实现分类[21]。支持向量机具有结构简单、适应性强、训练时间短、泛化性能好等优点。此外,与人工神经网络容易陷入局部最优解的缺点相比,支持向量机全局寻优性能好,但模型精度和效率很大程度上取决于模型参数值的选取。
国内外学者已将多源数据融合技术引入水利行业诸多领域,例如,降水估计[22]、径流/洪水预报[23-24]、含沙量测量[25]、水库调度[26]、滑坡变形监测[20,27-28]等。
3 多源数据融合技术在水质监测评价中的应用
水环境是一个动态变化的复杂系统,为在不增加监测资源消耗的前提下更加全面、科学、精细地描述水质状况,需要充分整合基于不同目的、通过不同途径采集到的水环境数据,使监测数据得以二次利用(Secondary Use)[29]。基于数据融合的水质评价方法实质上是建立多源数据与水质参数、类别或状态之间的映射关系[30]。多源数据融合技术在水质监测评价工作中已有不少研究成果,根据监测数据来源的不同组合方式,从空间上来划分,主要分为地面数据融合、地空数据融合、多源遥感数据融合。
(1)地面数据融合。地面数据融合主要是对同一监测对象同一水质项目不同地面传感器数据进行融合,从而获得该水质项目更为精确的值;或对同一监测对象不同水质项目数据进行融合,从而获得该对象水质状况的综合评价结果。Li等[31]将自适应加权算法应用于pH值、水温、溶解氧等水质指标多传感器监测数据融合,并采用格拉布斯(Grubbs)准则进行误差、缺失数据处理。唐菁敏等[32]采用无线传感器网络收集洱海水质数据,利用证据理论对多传感器获得的数据进行实时融合,结果表明该方法具有较高的稳定性,且与传统数据分析方法相比,在数据受外界因素影响波动较大时具有更好的水质检测性能。林志贵等[33]通过对长江口2002年1—3月水质监测数据进行融合处理,验证了D-S证据理论用于水质监测数据融合处理的可行性,并针对监测数据转化为证据时可能出现冲突或相关性等特点提出了改进方法,结果表明依据多个传感器获得的数据合成结果来判断水质状况可以有效处理监测数据的不确定性,对区域水质状况的描述更为确切。管军[16]通过构建基于支持向量机的水质评价模型对长江口2002年35组水质监测数据进行评价分类,并与基于BP神经网络和D-S证据理论融合的水质评价方法进行对比发现,支持向量机方法对水质类别的识别率略高。周剑等[34]提出了一种基于区间证据理论的多传感器获得的数据融合水质判断方法,考虑传感器误差、测量数据异常等问题,将每个传感器测量的水质数据用区间数表示,按照区间证据组合规则将多传感器的区间证据融合成综合区间证据,并根据决策准则判断水质等级,该方法可以有效处理传感器测量水质数据过程中存在的不确定性。胡东滨等[35]考虑流域内不同空间、时间水质多指标数据融合和不确定性数据处理,提出了一种基于证据理论推理的流域水质综合评价方法,2011—2017年湘江18个断面水质评价应用实例表明,该方法计算得到的各评估等级的概率分布对不确定性信息的处理更为科学,对流域水质状况的反映更为直观。
不少研究尝试将两种以上方法结合形成多层次数据融合,获得了较单一方法更好的数据融合效果。梁楠等[21]提出了一种证据理论和新型模糊支持向量机结合的水质数据融合方法,通过训练基于新型隶属函数的模糊支持向量机得到各样本从属于各水质类别的基本概率分配,进而采用D-S证据理论进行证据融合,海河流域水质数据融合试验表明,该方法的结果比较稳定,且较传统支持向量机得到的基本概率分配更为合理。朱琼瑶等[18]提出了基于粗糙集和D-S证据理论联合应用的水质预警算法,以高锰酸盐指数(CODMn)指标预测为例,通过与单属性拟合、粗糙集理论等方法对比,该方法在水质监测数据缺失、属性冗余、数据量偏少和不确定等条件下具有较好的预测效果。
(2)地空数据融合。遥感技术不受地面条件的限制,能在较短的时间内对大范围地区进行观测,信息获取速度快、周期短,可以动态获取地面信息,但相较于地面监测数据精确度较差,将遥感数据与地面监测信息融合可以充分利用多源数据特点对数据时空分辨率进行补偿,并对数据合理性和准确性进行校正。遥感水质参数反演方法是通过建立水体反射光谱特征与水质参数的统计关系反演得到水质参数,常用的经验分析法和半经验分析法实质上是一种地面—空间数据融合的监测方式[5],地面监测站点数据通常作为建立遥感反演模型的目标样本和验证依据,此外,辅以现场光谱采样数据等提高反演精度。目前遥感水质参数反演技术比较成熟的是总悬浮物、叶绿素a浓度、透明度、浊度等与水体光谱特征关系显著的光学活性物质,因此遥感监测技术主要应用于水体富营养化监测、水华预警等方面。
基于遥感监测技术的水质评价方法主要是通过模型反演得到关键水质参数进而根据相关标准对水质状况进行评价或判断。管军[16]引入支持向量机理论与方法,利用空中监测和地面监测信息的关联性,分别构建了基于Landsat-5卫星遥感图像与地面监测数据的水质监测信息融合处理模型和状况识别评价模型,并成功应用于太湖叶绿素a浓度监测和水质评价,实现了遥感图像對地面监测数据的有效补充。Duan等[36]基于Landsat-TM数据和现场实测光谱数据采用波段比值(TM4/TM3)算法估测了吉林省查干湖叶绿素a浓度,进而评价查干湖水体富营养化分布状况,经验证所建立的TM波段与叶绿素a浓度的关系模型具有一致性和可靠性。石爱业等[37]提出了一种知识和遥感图像相结合的神经网络水质反演模型,在Landsat-5的TM图像反演基础上融合了地理信息、水质分类等先验知识,经太湖流域试验验证该模型较常规线性回归模型和传统神经网络模型有更好的叶绿素a反演精度。宋挺等[38]综合利用Landsat-8卫星OLI传感器和地面多参数水质监测仪的自动监测数据对太湖进行了遥感监测,建立了红光和绿光波段的反演模型,对太湖水体蓝藻密度和浊度进行了估算反演。 水质参数反演模型采用单一或少数指标来评价水体水质状况不够全面,为获取水质综合评价结果,有关学者建立了遥感影像光学特征与水质类别或营养状态的直接关系。何报寅等[39]基于武汉市地面常规监测站网数据计算获得湖泊营养状态指数,利用中巴地球资源卫星CBERS-2数据反演水体营养状态指数,结果显示营养状态指数的自然对数值与CBERS-2图像灰度值之间具有较好的相关关系。朱小明[40]对GF-1号WFV卫星所监测到的多光谱水域图像数据信息进行处理,并结合部分时段的水质实测数据和水质类别评价结果对处理后的WFV数据进行标记,通过建立极限学习机模型实现了对太湖水域污染与否的定性判断。周亚东等[41]基于GF-1号WFV卫星数据和综合营养状态指数法,通过武汉及周边湖泊82个站点实测数据建立了多元线性回归和RBF神经网络模型,实现了大面积湖泊营养状态的动态监测与评价。
近年来,基于遥感技术的湖库营养状态监测已逐渐由过去针对单一湖库扩展至大范围、多湖库、长时序监测[42-44]。以水色指数FUI(Forel-Ule Index)为代表的基于水体光学参量的遥感反演技术克服了传统水质参数反演模型的时空局限性,对于区域乃至全球范围内长时间尺度水质反演具有较大潜力和优势,反演算法的不断改进与精度提升使得遥感技术在水质动态评价与预测工作中有了更为广阔的应用前景。例如,Wang等[45]提出了基于MODIS卫星数据与水色指数FUI的水体营养状态指数TSI(Trophic State Index)高精度反演算法,实现了全球范围内2 000余个水体贫营养、中营养、富营养3类状态的划分。
(3)多源遥感数据融合。随着卫星遥感技术和成像光谱仪技术的迅速发展,遥感水质监测已从最初的简单定性分析逐步发展到定量反演,遥感数据的时空分辨率和精度日益提升。常用于水质参数遥感反演的多光谱卫星主要有MODIS、MERIS、Landsat5/7/8、HJ星、GF-1号以及 Sentinel等[46]。不同卫星的使用年限不同,时空分辨率不同,监测效果有所差异,仅从单一遥感图像难以获取完整且清晰的图像信息[47-48]。遥感数据融合技术采用高级影像处理技术复合来自不同传感器的多时相、多尺度、多频段、多分辨率遥感影像数据,解决多源海量数据集成问题,是遥感技术在水环境监测领域应用向纵深发展的必然趋势。
多源遥感数据融合技术的关键是解决不同时空分辨率遥感影像的尺度效应难题。Tian等[49]构建了基于高分卫星遥感图像产品GF-1 WFV和MODIS数据的融合模型,并对香港西北部后海湾的总悬浮物浓度进行了监测,该方法为无法获取原位监测结果的区域水质监测提供了重要示范。石爱业等[50]构建了一种基于神经网络-证据理论的遥感图像融合方法,并以太湖水质监测数据为例进行实证分析,证明了该融合方法可以增强水质状况识别的容错性、提高可信度。段广拓[51]在对深圳近海水域的叶绿素a浓度、悬浮物浓度等水质参数反演研究中利用U-STFM模型对MODIS数据和Landsat 8数据进行时空融合,有效弥补了Landsat 8时间分辨率不足的缺陷,提高了监测的连续性。刘纯宇[52]采用Brovey变换对Landsat、MODIS、HJ-1A/B等不同类型的遥感影像数据进行处理和融合,获得了同时兼有Landsat高空间分辨率特性和MODIS多光谱特性的巢湖地区水华分布图像,为研究水华的时空分布规律提供了支撑。江辉[53]基于MODIS、TM/ETM+等多源卫星遥感数据,采用统计回归、RBF神经网络等方法分别建立了鄱阳湖总悬浮物浓度、总磷、透明度等水质参数的遥感反演模型,并根据丰、平、枯水期不同水体反射率波段特征提出了分期建模的方法,提高了模型的适用性。大数据算法的飞速发展为多源遥感图像融合处理提供了更多技术手段。Chang等[54]建立了一个能够实现多源卫星遥感影像自动融合和重构的平台,通过机器学习和数据挖掘等方法对融合后生成的图像信息进行智能提取,进而获得了相关的水质指标值。
除遥感影像数据多层次融合外,对不同遥感影像的水质参数反演结果进行融合处理也是解决遥感影像尺度问题的一种思路。例如,王珊[46]采用GF-1 WFV、Sentinel-2 MSI、Landsat 8 OLI等多源遙感数据分别构建了潘家口-大黑汀水库水质参数反演模型,经过不同模型反演结果差异性对比分析,利用集合建模思想进行权重分配,实现了不同空间分辨率遥感影像数据的融合。
4 建 议
(1)推进水环境多源监测业务体系建设。当前我国水质监测以人工监测为主、自动监测为辅,遥感监测在业务层面应用较少。随着自动监测、遥感监测等技术手段不断革新,新兴监测技术有望成为水环境监测由点向面、由静态向动态发展的重要支撑。为促进新兴监测技术的业务化应用,需要建立天-空-地一体化立体监测平台,开展多源协同、优势互补的动态监测。
(2)建立数据共享交换机制。在不提高当前监测站网密度、增加额外成本的条件下充分利用已有监测信息,打破水环境数据跨部门、跨业务的信息壁垒,整合多类型涉水数据、空间数据等,完善水环境监测“一张网”,建立不同层面上的数据共享机制和保障体系,形成数据融合处理的技术标准或规范。加强水环境数据库建设,集成模型构建综合决策平台,为预测预警、应急决策等提供参考。
(3)加强水质动态评价方法研究。多源数据融合的思路和方法有利于提高水质评价的质量和时效性,能够更为全面、动态地描述流域(区域)水质状况,但不同来源的数据可能存在异构、矛盾、异常、缺失以及不确定性等问题,传统水质评价方法存在一定局限性,需构建水质动态评价指标体系,并研究适应于多源数据结构特征的水质动态评价技术方法。
参考文献:
[1] 王永桂,张潇,张万顺.基于河长制的流域水环境精细化管理理念与需求[J].中国水利,2018(4):26-28. [2] 中华人民共和国水利部.地表水资源质量评价技术规程:SL 395—2007[S].北京:中国水利水电出版社,2007:1-2.
[3] 蒋云钟,万毅.水资源监控能力建设功能需求及实施策略[J].中国水利,2012(7):26-30.
[4] 张风彩,焦二虎.浅析水质监测新技术的应用[J].治淮,2015(1):62-63.
[5] 岩腊,龍笛,白亮亮,等.基于多源信息的水资源立体监测研究综述[J].遥感学报,2020,24(7):787-803.
[6] 邹凯,孙永华,李小娟,等.基于无人机遥感的水质监测研究综述[J].环境科学与技术,2019,42(增刊2):69-75.
[7] KHALEGHI B, KHAMIS A, KARRAY F O, et al.Multisensor Data Fusion: a Review of the State-of-the-Art[J]. Information Fusion, 2013, 14(1): 28-44.
[8] HALL D L, LLINAS J. An Introduction to Multisensor Data Fusion[J]. Proceedings of IEEE, 1997, 85(1): 6-23.
[9] 陈科文,张祖平,龙军.多源信息融合关键问题、研究进展与新动向[J].计算机科学,2013,40(8):6-13.
[10] CASTANEDO F. A Review of Data Fusion Techniques[J]. The Scientific World Journal, 2013(9):1-19.
[11] 宋秀峰.海洋水质检测系统中多传感器数据融合技术的研究[D].秦皇岛:燕山大学,2013:11-13.
[12] 祁友杰,王琦.多源数据融合算法综述[J].航天电子对抗,2017,33(6):37-41.
[13] 凌林本,李滋刚,陈超英,等.多传感器数据融合时权的最优分配原则[J].中国惯性技术学报,2000,8(2):33-36.
[14] 朱自强,吴顺川,刘洋,等.基于自适应Kalman滤波融合技术的边坡变形分析[J].矿业研究与开发,2020,40(1):16-21.
[15] 魏娟.基于集合卡尔曼滤波的太湖叶绿素同化模拟研究[D].南京:南京师范大学,2018:1-5.
[16] 管军.支持向量机在水质监测信息融合与评价中的应用研究[D].南京:河海大学,2006:15-17.
[17] 朱琼瑶.水质时序数据处理及预警系统数据库构建技术研究[D].杭州:浙江大学,2012:18-22.
[18] 朱琼瑶,张光新,冯天恒,等.基于粗糙集和证据理论的水质分析预警技术研究[J].浙江大学学报(农业与生命科学版),2012,38(6):747-754.
[19] 江爱晶.水环境在线监测与评价预警系统的研制与开发[D].南京:东南大学,2017:31-34.
[20] 王智伟,王利,黄观文,等.基于BP神经网络的滑坡监测多源异构数据融合算法研究[J].地质力学学报,2020,26(4):576-582.
[21] 梁楠,邹志红.结合新型模糊支持向量机和证据理论的多传感器水质数据融合[J].电讯技术,2020,60(3):331-337.
[22] TURLAPATY C A, ANANTHARAJ G V, YOUNAN H N, et al. Precipitation Data Fusion Using Vector Space Transformation and Artificial Neural Networks[J]. Pattern Recognition Letters, 2009, 31(10): 1184-1200.
[23] 赵悬涛,刘昌军,文磊,等.国产多源降水融合及其在小流域暴雨山洪预报中的应用[J].中国农村水利水电,2020(10):54-59,65.
[24] ABRAHART R J, SEE L. Multi-Model Data Fusion for River Flow Forecasting: an Evaluation of Six Alternative Methods Based on Two Contrasting Catchments[J]. Hydrology and Earth System Sciences, 2002, 6(4): 655-670.
[25] 刘明堂,田壮壮,齐慧勤,等.基于Kalman-BP协同融合模型的含沙量测量[J].应用基础与工程科学学报,2016,24(5):970-977.
[26] 杨旭,尚毅梓,刘志武,等.基于多源数据融合的金沙江下游-三峡梯级水库调度系统设计与应用[J].水利水电技术,2019,50(8):154-165.
[27] 张福荣.自适应卡尔曼滤波在变形监测数据处理中的应用研究[D].西安:长安大学,2009:2-8.
[28] HIBERT C, GRANDJEAN G, BITRI A, et al. Characterizing Landslides Through Geophysical Data Fusion: Example of the La Valette Landslide (France)[J]. Engineering Geology, 2012, 128: 23-29. [29] SPRAGUE L A, OELSNER G P, ARGUE D M. Challenges with Secondary Use of Multi-Source Water-Quality Data in the United States[J]. Water Research, 2017, 110: 252-261.
[30] 曾维华.多源信息融合技术在内陆湖库水华预警中的研究进展与展望[J].长江流域资源与环境,2009,18(1):72-78.
[31] LI D, SHEN C, DAI X, et al. Research on Data Fusion of Adaptive Weighted Multi-Source Sensor[J]. Computers, Materials & Continua, 2019, 61(3):1217-1231.
[32] 唐菁敏,徐春龍.基于洱海的多传感器数据融合水质检测[J].云南民族大学学报(自然科学版),2018,27(5):417-421.
[33] 林志贵,徐立中,黄凤辰,等.基于D-S理论的多源水质监测数据融合处理[J].计算机工程与应用,2004,40(10):3-5.
[34] 周剑,马晨昊,刘林峰,等.基于区间证据理论的多传感器数据融合水质判断方法[J].通信学报,2016,37(9):20-29.
[35] 胡东滨,蔡洪鹏,陈晓红,等.基于证据推理的流域水质综合评价法:以湘江水质评价为例[J].资源科学,2019,41(11):2020-2031.
[36] DUAN H, ZHANG Y, ZHANG B, et al. Assessment of Chlorophyll-a Concentration and Trophic State for Lake Chagan Using Landsat TM and Field Spectral Data[J]. Environmental Monitoring and Assessment, 2007, 129(1-3): 295-308.
[37] 石爱业,徐立中,杨先一,等.基于知识和遥感图像的神经网络水质反演模型[J].中国图象图形学报,2006,11(4):521-528.
[38] 宋挺,石俊哲,刘军志,等.基于Landsat-8卫星OLI数据的太湖水体蓝藻密度和浊度遥感定量反演研究[J].安全与环境工程,2015,22(6):67-71,78.
[39] 何报寅,梁胜文,丁超,等.利用中巴地球资源卫星数据反演武汉市湖泊营养状态指数[J].长江流域资源与环境,2009,18(12):1181-1186.
[40] 朱小明.基于多光谱遥感图像信息的水质污染监测研究[J].计算机技术与发展,2018,28(10):52-60.
[41] 周亚东,何报寅,寇杰锋,等.基于GF-1号遥感影像的武汉市及周边湖泊综合营养状态指数反演[J].长江流域资源与环境,2018,27(6):1307-1314.
[42] KNIGHT J F, VOTH M L. Application of MODIS Imagery for Intra-Annual Water Clarity Assessment of Minnesota Lakes[J]. Remote Sensing, 2012,4(7): 2181-2198.
[43] MATTHEWS M W. Eutrophication andCyanobacterial Blooms in South African Inland Waters: 10 Years of MERIS Observations[J]. Remote Sensing of Environment, 2014, 155: 161-177.
[44] 张兵,李俊生,申茜,等.地表水环境遥感监测关键技术与系统[J].中国环境监测,2019,35(4):1-9.
[45] WANG S, LI J, ZHANG B, et al. Trophic State Assessment of Global Inland Waters Using a MODIS-Derived Forel-Ule Index[J]. Remote Sensing of Environment, 2018, 217: 444-460.
[46] 王珊.基于多源遥感影像的潘家口-大黑汀水库水质变化监测与分析[D].兰州:兰州交通大学,2019:5-8.
[47] 曹杨,尚士友,杨景荣,等.多源遥感数据在湖泊湿地信息提取中的应用[J].人民黄河,2010,32(2):5-9.
[48] 陈琳,贾化乐,杨中华,等.应用多星多源数据组合动态监测黄河凌汛进程[J].人民黄河,2013,35(6):32-35.
[49] TIAN L, WAI O W H, CHEN X, et al. Retrieval of Total Suspended Matter Concentration from Gaofen-1 Wide Field Imager (WFI) Multispectral Imagery with the Assistance of Terra MODIS in Turbid Water-Case in Deep Bay[J]. International Journal of Remote Sensing, 2016, 37(14): 3400-3413.
[50] 石爱业,徐立中,杨先一,等.基于神经网络-证据理论的遥感图像数据融合与湖泊水质状况识别[J].中国图象图形学报,2005,10(3):372-377.
[51] 段广拓.基于多源遥感数据的水环境参量反演算法研究与应用[D].深圳:中国科学院大学,2019:8-18.
[52] 刘纯宇.基于多源遥感影像数据融合的巢湖水华时空动态反演[D].合肥:安徽农业大学,2019:6-9.
[53] 江辉.基于多源遥感的鄱阳湖水质参数反演与分析[D].南昌:南昌大学,2011:7-13.
[54] CHANG N B, BAI K, CHEN C F. Integrating Multisensor Satellite Data Merging and Image Reconstruction in Support of Machine Learning for Better Water Quality Management[J]. Journal of Environmental Management, 2017, 201: 227-240.
【责任编辑 吕艳梅】
关键词:多源数据;数据融合;水质监测;水质评价;水质预测;预警
Abstract:The precision and time-effectiveness of water quality evaluation are required by the delicacy management of water environment. China has accumulated a large amount of data in the long-term construction of the water environment monitoring system, so it is urgent to study and establish key technologies for dynamic water quality evaluation based on multi-source monitoring and data fusion. This paper systematically discussed the supporting conditions for the implementation of dynamic water quality evaluation and summarized the deficiencies in the effective use of data, such as obvious data island phenomenon, blocked data sharing and insufficient data fusion. Then we sorted out the main techniques and methods of multi-source data fusion, e.g., Weighted Average Method, Kalman Filter, Dempster-Shafer Evidence Theory and Rough Set Theory. Moreover, we reviewed the research status and application prospect of multi-source data fusion technology in the field of water quality monitoring and evaluation by categories (i.e., ground data fusion, ground-space data fusion and multi-source remote sensing data fusion) and finally put forward relevant countermeasures and suggestions.
Key words: multisource data; data fusion; water quality monitoring; water quality evaluation; water quality prediction; early warning
當前我国水环境质量状况不容乐观,水环境污染已成为新时期水安全保障面临的主要问题之一。过去简单、粗放式的水环境管理模式已难以满足现阶段水环境治理与保护的迫切需要,水环境精细化管理成为我国水环境管理发展的必然趋势[1]。地表水资源质量评价一般简称水质评价,是根据地表水资源开发利用和保护要求,参考国家和有关部门制定的各类水质标准,对地表水水质状况进行的评价[2]。水质评价是水环境管理的重要环节,通过对采集到的数据进行水质评价可以掌握当前水体水质状况,预测未来水质变化趋势,从而为水资源合理利用、优化配置和节约保护,以及水污染防治等决策工作提供科学支撑。
当前,流域及区域地表水水质评价工作主要是在年尺度上进行的。在我国持续推进水环境精细化管理的背景下,传统水质评价方法在时效性上存在一定短板,因缺乏对未来情势的分析研判,难以支撑水质动态、精细和科学管理需求。信息技术的发展为提高水质评价的时效性和预测预警能力提供了可能条件。为与新兴水质监测手段和数据获取方式相协调,迫切需要研究建立突破时空尺度局限性的水质动态评价关键技术。
1 实施水质动态评价的支撑条件与不足
1.1 支撑条件
(1)有关政策引领。2011年中央一号文件明确要求“加强水量水质监测能力建设,为强化监督考核提供技术支撑”。2012年,国务院《关于实行最严格水资源管理制度的意见》提出将“健全水资源监控体系”作为实行最严格水资源管理制度的重要保障措施[3]。近年来,水利部、生态环境部等有关部门在加强水资源、水环境、水生态监测体系建设过程中开展了一系列相关工作,在提高监测覆盖范围、监测频次、自动化程度等方面进行了大量有益探索。随着监测站网的不断完善以及监测技术手段的不断革新,积累了大量多来源、多尺度、多类型的水环境监测数据。为深入贯彻落实党中央提出的“国家大数据战略”、国务院印发的《促进大数据发展行动纲要》等系列决策部署,2016年,原环境保护部发布了《生态环境大数据建设总体方案》,要求把大数据技术作为推进环境治理体系和治理能力现代化的重要手段,实现生态环境综合决策科学化、生态环境监管精准化、生态环境公共服务便民化。2017年,水利部印发《关于推进水利大数据发展的指导意见》,旨在推进水利行业数据资源共享开放,促进水利大数据发展与创新应用,其中明确提出应用现代化信息技术增强水环境监测监管能力是一项重点任务。 (2)水质监测技术发展。水质监测是水质评价的基础。水质监测的传统方式是专业人员野外取样后送到实验室进行水质项目分析化验,这种方式监测项目全面、分析结果较为准确,但耗时长、成本高,且受自然、气候、水文等条件限制,难以长时间、大范围、高频次地跟踪监测。随着科技迅猛发展,各类水质监测新兴技术纷纷涌现。自动在线监测是把传感器和自动化分析仪组合起来,配套先进的控制芯片、网络通信和专业分析软件,实现从水样采集、分析到传输、处理以及存储整个过程的高度自动化[4]。自动在线监测方法信息获取及时、预警能力强,但监测项目少、仪器设备维护成本较高,且受仪器影响易出现数据异常现象。遥感监测是利用水体污染物在特定波长范围对光吸收和反射特性的差异,通过遥感影像光谱特征识别污染物种类、范围和浓度的技术[5]。遥感监测方法具有覆盖范围广、信息量大、效率高、成本低等优点,但监测项目少、精度偏低、适用性较差。此外,无人机、无人船等通过搭载高光谱传感器和水质参数分析仪对水体进行监测,从而实时监控和掌握水体水质的动态信息,为水质监测提供了新的途径[6]。总体而言,鉴于对水质监测数据准确性和可靠性的要求,现阶段水质评价工作中仍以人工采样数据为主,自动在线监测数据主要用于预报预警,卫星遥感解译监测数据的应用还处于研究探索阶段。
1.2 不足之处
尽管我国在长期水环境监测体系建设过程中积累了大量数据,但在数据有效利用方面存在不足,主要表现在以下几方面。
(1)数据孤岛现象较明显。水环境监测多是根据某一特定需求(如最严格水资源管理制度考核工作)开展的,并未将已获得数据应用于其他有关工作。这就造成本应紧密联系、相互配合的数据之间缺乏互通性,无法通过数据融合与挖掘获取更有效、更全面的信息,不能为水环境全局管理提供多角度、多层面的信息服务。因不同目的重复监测同一对象,也会增加不必要的人力、物力成本。
(2)数据共享不畅通。水环境数据长期以来分布在水利、环保、住建等部门,由于部门壁垒存在,因此数据共享存在固有困难,加之不同部门数据量、数据格式、存储方式等均有较大差别,缺乏统一的数据标准和共享要求等,使得水环境数据共享渠道不畅通。
(3)数据有机融合不充分。不同监测手段获取的数据缺乏统一的数据审核规则和技术体系,水质项目分析方法也存在差别,使有机融合存在一定困难。现阶段多源数据融合多是数据的叠加和汇总,实质性融合较少,尚未充分发挥多源数据之间的优势互补作用。
2 多源数据融合方法
通过不同监测手段获取的数据既有相关性也有异构性,并且难免存在不一致甚至矛盾之处。传统数据处理方法在处理这类数据时具有一定局限性,为克服这一问题,多源数据融合理论应运而生。多源数据融合涉及多学科知识,不同学科对这一概念的定义有所不同,从广义上来讲,是指对多个来源的数据通过识别、关联、估计、优化组合等方式进行处理,消除数据在时空维度上的冗余性、互斥性和不确定性,最终形成较单一数据来源更精细、更准确、更可靠的统一表达的过程[7-8]。数据是信息的载体,对信息的自动分析过程也是数据处理的过程,多源数据融合也称多源信息融合(Multi-Source Information Fusion)、多传感器信息融合(Multi-Sensor Data Fusion)等。Khaleghi等[7]认为,数据融合技术面临的主要挑战源于输入数据的缺陷性、相关性、不连续性和差异性,这也是数据融合算法研究需要攻克的主要问题,见图1。
多源数据融合技术自20世纪70年代末兴起,随着信息技术的发展,新理论、新技术和新方法层出不穷,多源数据融合技术广泛应用于不同领域[9]。根据融合层次、算法概念、操作原理、发展脉络等特征可以将数据融合技术方法划分为不同类型[10-12],见图2。
(1)加权平均法。加权平均法是最简单、最实用的数据融合方法。当多个传感器对同一个参数进行测量时,数据融合时一般可以采用加权平均法。该方法的融合效果主要取决于权重分配。在已知传感器精度的条件下,采用多元统计理论可以推导出多传感器数据融合的最优权重[13]。
(2)卡尔曼滤波。卡尔曼滤波是目前应用最广泛的状态估计算法。该方法的基本思想是,以最小均方误差为最佳估计准则,利用前一时刻的估计值和当前时刻的观测值更新对状态变量的估计,通过循环递归来实现状态预估和测量更新的拟合校验,从而对监测数据误差进行滤波处理[14]。卡尔曼滤波可以实时快速处理大量动态数据,常用于不同来源观测数据和数值模拟模型结果的融合[15],通过修正数值模拟运行轨迹,提高模拟精度。但在实际应用中,可能因模型的不确定性、干扰信号统计特性不完全已知等因素导致算法误差增大。
(3)D-S证据理论。D-S证据理论是一种处理不确定性推理问题的数学方法。其基本原理是将多源数据视为各个证据,利用Dempster组合规则进行证据组合,并计算各个证据和证据组合后的基本可信度分配函数、信任度函数和似然函数,最后根据一定的目标判定原则选择证据联合作用下支持度最大的假设,从而实现数据融合和决策选择[16]。D-S证据理论技术成熟、应用广泛,是贝叶斯理论的广义扩展,但比贝叶斯理论对先验知识的要求低,因而在处理不确定性问题时更为简单灵活[17]。缺点在于不能有效处理矛盾数据,当证据间存在冲突时可能出现异常甚至错误结果,此外,隨着数据和推理步数增加计算量呈幂指数增长,导致计算量爆炸。
(4)粗糙集理论。粗糙集理论主要用于对不精确、不完备、模糊数据进行归纳学习从而发现隐含知识,目前已广泛应用于多指标综合评价。其主要思想是首先利用属性约简原理删除冗余指标,然后基于简化后的信息表进行规则提取,进而完成知识库的构建[18]。粗糙集理论可以较好地解决时间序列数据中可能存在的时间不连续现象,消除数据冲突、约简数据,减少后续数据处理的工作量,同时最大限度地保留原始数据信息。该方法优点在于客观性较强,无须先验知识,允许同时使用定性和定量数据,缺点是错误判断的决定性机制简单,可能导致提取的决策规则不稳定。 (5)人工神经网络。人工神经网络近年来在多源数据融合研究领域发展迅速。人工神经网络是以网络拓扑知识为理论基础,模拟人脑神经系统对复杂信息处理机制的一种数学模型。该方法具有较强的自学习性、自组织性和良好的适应性、容错性,其非线性映射能力能拟合任意复杂的非线性函数。目前应用最广泛且较成功的人工神经网络模型是BP神经网络模型[19]。BP神经网络模型拓扑结构包括输入层、隐含层和输出层,运算包括信息的正向传播和误差的反向传播两部分,基本原理是利用梯度下降法求解使误差函数最小的网络权重最优值[20]。BP神经网络模型各层神经元个数和隐含层层数选取对于模型训练时间和稳定性有较大影响。
(6)支持向量机。支持向量机是在统计学习理论基础上发展起来的机器学习方法,是一种按监督学习来对数据进行二分类的广义线性分类器。支持向量机在非线性模式识别上的优良性能使其在分类评价工作中广泛应用。其基本原理是通过非线性变换将训练集样本映射到高维特征空间,并在高维特征空间中寻找一个最优分类超平面使训练集中的点距离分类面尽可能远,从而实现分类[21]。支持向量机具有结构简单、适应性强、训练时间短、泛化性能好等优点。此外,与人工神经网络容易陷入局部最优解的缺点相比,支持向量机全局寻优性能好,但模型精度和效率很大程度上取决于模型参数值的选取。
国内外学者已将多源数据融合技术引入水利行业诸多领域,例如,降水估计[22]、径流/洪水预报[23-24]、含沙量测量[25]、水库调度[26]、滑坡变形监测[20,27-28]等。
3 多源数据融合技术在水质监测评价中的应用
水环境是一个动态变化的复杂系统,为在不增加监测资源消耗的前提下更加全面、科学、精细地描述水质状况,需要充分整合基于不同目的、通过不同途径采集到的水环境数据,使监测数据得以二次利用(Secondary Use)[29]。基于数据融合的水质评价方法实质上是建立多源数据与水质参数、类别或状态之间的映射关系[30]。多源数据融合技术在水质监测评价工作中已有不少研究成果,根据监测数据来源的不同组合方式,从空间上来划分,主要分为地面数据融合、地空数据融合、多源遥感数据融合。
(1)地面数据融合。地面数据融合主要是对同一监测对象同一水质项目不同地面传感器数据进行融合,从而获得该水质项目更为精确的值;或对同一监测对象不同水质项目数据进行融合,从而获得该对象水质状况的综合评价结果。Li等[31]将自适应加权算法应用于pH值、水温、溶解氧等水质指标多传感器监测数据融合,并采用格拉布斯(Grubbs)准则进行误差、缺失数据处理。唐菁敏等[32]采用无线传感器网络收集洱海水质数据,利用证据理论对多传感器获得的数据进行实时融合,结果表明该方法具有较高的稳定性,且与传统数据分析方法相比,在数据受外界因素影响波动较大时具有更好的水质检测性能。林志贵等[33]通过对长江口2002年1—3月水质监测数据进行融合处理,验证了D-S证据理论用于水质监测数据融合处理的可行性,并针对监测数据转化为证据时可能出现冲突或相关性等特点提出了改进方法,结果表明依据多个传感器获得的数据合成结果来判断水质状况可以有效处理监测数据的不确定性,对区域水质状况的描述更为确切。管军[16]通过构建基于支持向量机的水质评价模型对长江口2002年35组水质监测数据进行评价分类,并与基于BP神经网络和D-S证据理论融合的水质评价方法进行对比发现,支持向量机方法对水质类别的识别率略高。周剑等[34]提出了一种基于区间证据理论的多传感器获得的数据融合水质判断方法,考虑传感器误差、测量数据异常等问题,将每个传感器测量的水质数据用区间数表示,按照区间证据组合规则将多传感器的区间证据融合成综合区间证据,并根据决策准则判断水质等级,该方法可以有效处理传感器测量水质数据过程中存在的不确定性。胡东滨等[35]考虑流域内不同空间、时间水质多指标数据融合和不确定性数据处理,提出了一种基于证据理论推理的流域水质综合评价方法,2011—2017年湘江18个断面水质评价应用实例表明,该方法计算得到的各评估等级的概率分布对不确定性信息的处理更为科学,对流域水质状况的反映更为直观。
不少研究尝试将两种以上方法结合形成多层次数据融合,获得了较单一方法更好的数据融合效果。梁楠等[21]提出了一种证据理论和新型模糊支持向量机结合的水质数据融合方法,通过训练基于新型隶属函数的模糊支持向量机得到各样本从属于各水质类别的基本概率分配,进而采用D-S证据理论进行证据融合,海河流域水质数据融合试验表明,该方法的结果比较稳定,且较传统支持向量机得到的基本概率分配更为合理。朱琼瑶等[18]提出了基于粗糙集和D-S证据理论联合应用的水质预警算法,以高锰酸盐指数(CODMn)指标预测为例,通过与单属性拟合、粗糙集理论等方法对比,该方法在水质监测数据缺失、属性冗余、数据量偏少和不确定等条件下具有较好的预测效果。
(2)地空数据融合。遥感技术不受地面条件的限制,能在较短的时间内对大范围地区进行观测,信息获取速度快、周期短,可以动态获取地面信息,但相较于地面监测数据精确度较差,将遥感数据与地面监测信息融合可以充分利用多源数据特点对数据时空分辨率进行补偿,并对数据合理性和准确性进行校正。遥感水质参数反演方法是通过建立水体反射光谱特征与水质参数的统计关系反演得到水质参数,常用的经验分析法和半经验分析法实质上是一种地面—空间数据融合的监测方式[5],地面监测站点数据通常作为建立遥感反演模型的目标样本和验证依据,此外,辅以现场光谱采样数据等提高反演精度。目前遥感水质参数反演技术比较成熟的是总悬浮物、叶绿素a浓度、透明度、浊度等与水体光谱特征关系显著的光学活性物质,因此遥感监测技术主要应用于水体富营养化监测、水华预警等方面。
基于遥感监测技术的水质评价方法主要是通过模型反演得到关键水质参数进而根据相关标准对水质状况进行评价或判断。管军[16]引入支持向量机理论与方法,利用空中监测和地面监测信息的关联性,分别构建了基于Landsat-5卫星遥感图像与地面监测数据的水质监测信息融合处理模型和状况识别评价模型,并成功应用于太湖叶绿素a浓度监测和水质评价,实现了遥感图像對地面监测数据的有效补充。Duan等[36]基于Landsat-TM数据和现场实测光谱数据采用波段比值(TM4/TM3)算法估测了吉林省查干湖叶绿素a浓度,进而评价查干湖水体富营养化分布状况,经验证所建立的TM波段与叶绿素a浓度的关系模型具有一致性和可靠性。石爱业等[37]提出了一种知识和遥感图像相结合的神经网络水质反演模型,在Landsat-5的TM图像反演基础上融合了地理信息、水质分类等先验知识,经太湖流域试验验证该模型较常规线性回归模型和传统神经网络模型有更好的叶绿素a反演精度。宋挺等[38]综合利用Landsat-8卫星OLI传感器和地面多参数水质监测仪的自动监测数据对太湖进行了遥感监测,建立了红光和绿光波段的反演模型,对太湖水体蓝藻密度和浊度进行了估算反演。 水质参数反演模型采用单一或少数指标来评价水体水质状况不够全面,为获取水质综合评价结果,有关学者建立了遥感影像光学特征与水质类别或营养状态的直接关系。何报寅等[39]基于武汉市地面常规监测站网数据计算获得湖泊营养状态指数,利用中巴地球资源卫星CBERS-2数据反演水体营养状态指数,结果显示营养状态指数的自然对数值与CBERS-2图像灰度值之间具有较好的相关关系。朱小明[40]对GF-1号WFV卫星所监测到的多光谱水域图像数据信息进行处理,并结合部分时段的水质实测数据和水质类别评价结果对处理后的WFV数据进行标记,通过建立极限学习机模型实现了对太湖水域污染与否的定性判断。周亚东等[41]基于GF-1号WFV卫星数据和综合营养状态指数法,通过武汉及周边湖泊82个站点实测数据建立了多元线性回归和RBF神经网络模型,实现了大面积湖泊营养状态的动态监测与评价。
近年来,基于遥感技术的湖库营养状态监测已逐渐由过去针对单一湖库扩展至大范围、多湖库、长时序监测[42-44]。以水色指数FUI(Forel-Ule Index)为代表的基于水体光学参量的遥感反演技术克服了传统水质参数反演模型的时空局限性,对于区域乃至全球范围内长时间尺度水质反演具有较大潜力和优势,反演算法的不断改进与精度提升使得遥感技术在水质动态评价与预测工作中有了更为广阔的应用前景。例如,Wang等[45]提出了基于MODIS卫星数据与水色指数FUI的水体营养状态指数TSI(Trophic State Index)高精度反演算法,实现了全球范围内2 000余个水体贫营养、中营养、富营养3类状态的划分。
(3)多源遥感数据融合。随着卫星遥感技术和成像光谱仪技术的迅速发展,遥感水质监测已从最初的简单定性分析逐步发展到定量反演,遥感数据的时空分辨率和精度日益提升。常用于水质参数遥感反演的多光谱卫星主要有MODIS、MERIS、Landsat5/7/8、HJ星、GF-1号以及 Sentinel等[46]。不同卫星的使用年限不同,时空分辨率不同,监测效果有所差异,仅从单一遥感图像难以获取完整且清晰的图像信息[47-48]。遥感数据融合技术采用高级影像处理技术复合来自不同传感器的多时相、多尺度、多频段、多分辨率遥感影像数据,解决多源海量数据集成问题,是遥感技术在水环境监测领域应用向纵深发展的必然趋势。
多源遥感数据融合技术的关键是解决不同时空分辨率遥感影像的尺度效应难题。Tian等[49]构建了基于高分卫星遥感图像产品GF-1 WFV和MODIS数据的融合模型,并对香港西北部后海湾的总悬浮物浓度进行了监测,该方法为无法获取原位监测结果的区域水质监测提供了重要示范。石爱业等[50]构建了一种基于神经网络-证据理论的遥感图像融合方法,并以太湖水质监测数据为例进行实证分析,证明了该融合方法可以增强水质状况识别的容错性、提高可信度。段广拓[51]在对深圳近海水域的叶绿素a浓度、悬浮物浓度等水质参数反演研究中利用U-STFM模型对MODIS数据和Landsat 8数据进行时空融合,有效弥补了Landsat 8时间分辨率不足的缺陷,提高了监测的连续性。刘纯宇[52]采用Brovey变换对Landsat、MODIS、HJ-1A/B等不同类型的遥感影像数据进行处理和融合,获得了同时兼有Landsat高空间分辨率特性和MODIS多光谱特性的巢湖地区水华分布图像,为研究水华的时空分布规律提供了支撑。江辉[53]基于MODIS、TM/ETM+等多源卫星遥感数据,采用统计回归、RBF神经网络等方法分别建立了鄱阳湖总悬浮物浓度、总磷、透明度等水质参数的遥感反演模型,并根据丰、平、枯水期不同水体反射率波段特征提出了分期建模的方法,提高了模型的适用性。大数据算法的飞速发展为多源遥感图像融合处理提供了更多技术手段。Chang等[54]建立了一个能够实现多源卫星遥感影像自动融合和重构的平台,通过机器学习和数据挖掘等方法对融合后生成的图像信息进行智能提取,进而获得了相关的水质指标值。
除遥感影像数据多层次融合外,对不同遥感影像的水质参数反演结果进行融合处理也是解决遥感影像尺度问题的一种思路。例如,王珊[46]采用GF-1 WFV、Sentinel-2 MSI、Landsat 8 OLI等多源遙感数据分别构建了潘家口-大黑汀水库水质参数反演模型,经过不同模型反演结果差异性对比分析,利用集合建模思想进行权重分配,实现了不同空间分辨率遥感影像数据的融合。
4 建 议
(1)推进水环境多源监测业务体系建设。当前我国水质监测以人工监测为主、自动监测为辅,遥感监测在业务层面应用较少。随着自动监测、遥感监测等技术手段不断革新,新兴监测技术有望成为水环境监测由点向面、由静态向动态发展的重要支撑。为促进新兴监测技术的业务化应用,需要建立天-空-地一体化立体监测平台,开展多源协同、优势互补的动态监测。
(2)建立数据共享交换机制。在不提高当前监测站网密度、增加额外成本的条件下充分利用已有监测信息,打破水环境数据跨部门、跨业务的信息壁垒,整合多类型涉水数据、空间数据等,完善水环境监测“一张网”,建立不同层面上的数据共享机制和保障体系,形成数据融合处理的技术标准或规范。加强水环境数据库建设,集成模型构建综合决策平台,为预测预警、应急决策等提供参考。
(3)加强水质动态评价方法研究。多源数据融合的思路和方法有利于提高水质评价的质量和时效性,能够更为全面、动态地描述流域(区域)水质状况,但不同来源的数据可能存在异构、矛盾、异常、缺失以及不确定性等问题,传统水质评价方法存在一定局限性,需构建水质动态评价指标体系,并研究适应于多源数据结构特征的水质动态评价技术方法。
参考文献:
[1] 王永桂,张潇,张万顺.基于河长制的流域水环境精细化管理理念与需求[J].中国水利,2018(4):26-28. [2] 中华人民共和国水利部.地表水资源质量评价技术规程:SL 395—2007[S].北京:中国水利水电出版社,2007:1-2.
[3] 蒋云钟,万毅.水资源监控能力建设功能需求及实施策略[J].中国水利,2012(7):26-30.
[4] 张风彩,焦二虎.浅析水质监测新技术的应用[J].治淮,2015(1):62-63.
[5] 岩腊,龍笛,白亮亮,等.基于多源信息的水资源立体监测研究综述[J].遥感学报,2020,24(7):787-803.
[6] 邹凯,孙永华,李小娟,等.基于无人机遥感的水质监测研究综述[J].环境科学与技术,2019,42(增刊2):69-75.
[7] KHALEGHI B, KHAMIS A, KARRAY F O, et al.Multisensor Data Fusion: a Review of the State-of-the-Art[J]. Information Fusion, 2013, 14(1): 28-44.
[8] HALL D L, LLINAS J. An Introduction to Multisensor Data Fusion[J]. Proceedings of IEEE, 1997, 85(1): 6-23.
[9] 陈科文,张祖平,龙军.多源信息融合关键问题、研究进展与新动向[J].计算机科学,2013,40(8):6-13.
[10] CASTANEDO F. A Review of Data Fusion Techniques[J]. The Scientific World Journal, 2013(9):1-19.
[11] 宋秀峰.海洋水质检测系统中多传感器数据融合技术的研究[D].秦皇岛:燕山大学,2013:11-13.
[12] 祁友杰,王琦.多源数据融合算法综述[J].航天电子对抗,2017,33(6):37-41.
[13] 凌林本,李滋刚,陈超英,等.多传感器数据融合时权的最优分配原则[J].中国惯性技术学报,2000,8(2):33-36.
[14] 朱自强,吴顺川,刘洋,等.基于自适应Kalman滤波融合技术的边坡变形分析[J].矿业研究与开发,2020,40(1):16-21.
[15] 魏娟.基于集合卡尔曼滤波的太湖叶绿素同化模拟研究[D].南京:南京师范大学,2018:1-5.
[16] 管军.支持向量机在水质监测信息融合与评价中的应用研究[D].南京:河海大学,2006:15-17.
[17] 朱琼瑶.水质时序数据处理及预警系统数据库构建技术研究[D].杭州:浙江大学,2012:18-22.
[18] 朱琼瑶,张光新,冯天恒,等.基于粗糙集和证据理论的水质分析预警技术研究[J].浙江大学学报(农业与生命科学版),2012,38(6):747-754.
[19] 江爱晶.水环境在线监测与评价预警系统的研制与开发[D].南京:东南大学,2017:31-34.
[20] 王智伟,王利,黄观文,等.基于BP神经网络的滑坡监测多源异构数据融合算法研究[J].地质力学学报,2020,26(4):576-582.
[21] 梁楠,邹志红.结合新型模糊支持向量机和证据理论的多传感器水质数据融合[J].电讯技术,2020,60(3):331-337.
[22] TURLAPATY C A, ANANTHARAJ G V, YOUNAN H N, et al. Precipitation Data Fusion Using Vector Space Transformation and Artificial Neural Networks[J]. Pattern Recognition Letters, 2009, 31(10): 1184-1200.
[23] 赵悬涛,刘昌军,文磊,等.国产多源降水融合及其在小流域暴雨山洪预报中的应用[J].中国农村水利水电,2020(10):54-59,65.
[24] ABRAHART R J, SEE L. Multi-Model Data Fusion for River Flow Forecasting: an Evaluation of Six Alternative Methods Based on Two Contrasting Catchments[J]. Hydrology and Earth System Sciences, 2002, 6(4): 655-670.
[25] 刘明堂,田壮壮,齐慧勤,等.基于Kalman-BP协同融合模型的含沙量测量[J].应用基础与工程科学学报,2016,24(5):970-977.
[26] 杨旭,尚毅梓,刘志武,等.基于多源数据融合的金沙江下游-三峡梯级水库调度系统设计与应用[J].水利水电技术,2019,50(8):154-165.
[27] 张福荣.自适应卡尔曼滤波在变形监测数据处理中的应用研究[D].西安:长安大学,2009:2-8.
[28] HIBERT C, GRANDJEAN G, BITRI A, et al. Characterizing Landslides Through Geophysical Data Fusion: Example of the La Valette Landslide (France)[J]. Engineering Geology, 2012, 128: 23-29. [29] SPRAGUE L A, OELSNER G P, ARGUE D M. Challenges with Secondary Use of Multi-Source Water-Quality Data in the United States[J]. Water Research, 2017, 110: 252-261.
[30] 曾维华.多源信息融合技术在内陆湖库水华预警中的研究进展与展望[J].长江流域资源与环境,2009,18(1):72-78.
[31] LI D, SHEN C, DAI X, et al. Research on Data Fusion of Adaptive Weighted Multi-Source Sensor[J]. Computers, Materials & Continua, 2019, 61(3):1217-1231.
[32] 唐菁敏,徐春龍.基于洱海的多传感器数据融合水质检测[J].云南民族大学学报(自然科学版),2018,27(5):417-421.
[33] 林志贵,徐立中,黄凤辰,等.基于D-S理论的多源水质监测数据融合处理[J].计算机工程与应用,2004,40(10):3-5.
[34] 周剑,马晨昊,刘林峰,等.基于区间证据理论的多传感器数据融合水质判断方法[J].通信学报,2016,37(9):20-29.
[35] 胡东滨,蔡洪鹏,陈晓红,等.基于证据推理的流域水质综合评价法:以湘江水质评价为例[J].资源科学,2019,41(11):2020-2031.
[36] DUAN H, ZHANG Y, ZHANG B, et al. Assessment of Chlorophyll-a Concentration and Trophic State for Lake Chagan Using Landsat TM and Field Spectral Data[J]. Environmental Monitoring and Assessment, 2007, 129(1-3): 295-308.
[37] 石爱业,徐立中,杨先一,等.基于知识和遥感图像的神经网络水质反演模型[J].中国图象图形学报,2006,11(4):521-528.
[38] 宋挺,石俊哲,刘军志,等.基于Landsat-8卫星OLI数据的太湖水体蓝藻密度和浊度遥感定量反演研究[J].安全与环境工程,2015,22(6):67-71,78.
[39] 何报寅,梁胜文,丁超,等.利用中巴地球资源卫星数据反演武汉市湖泊营养状态指数[J].长江流域资源与环境,2009,18(12):1181-1186.
[40] 朱小明.基于多光谱遥感图像信息的水质污染监测研究[J].计算机技术与发展,2018,28(10):52-60.
[41] 周亚东,何报寅,寇杰锋,等.基于GF-1号遥感影像的武汉市及周边湖泊综合营养状态指数反演[J].长江流域资源与环境,2018,27(6):1307-1314.
[42] KNIGHT J F, VOTH M L. Application of MODIS Imagery for Intra-Annual Water Clarity Assessment of Minnesota Lakes[J]. Remote Sensing, 2012,4(7): 2181-2198.
[43] MATTHEWS M W. Eutrophication andCyanobacterial Blooms in South African Inland Waters: 10 Years of MERIS Observations[J]. Remote Sensing of Environment, 2014, 155: 161-177.
[44] 张兵,李俊生,申茜,等.地表水环境遥感监测关键技术与系统[J].中国环境监测,2019,35(4):1-9.
[45] WANG S, LI J, ZHANG B, et al. Trophic State Assessment of Global Inland Waters Using a MODIS-Derived Forel-Ule Index[J]. Remote Sensing of Environment, 2018, 217: 444-460.
[46] 王珊.基于多源遥感影像的潘家口-大黑汀水库水质变化监测与分析[D].兰州:兰州交通大学,2019:5-8.
[47] 曹杨,尚士友,杨景荣,等.多源遥感数据在湖泊湿地信息提取中的应用[J].人民黄河,2010,32(2):5-9.
[48] 陈琳,贾化乐,杨中华,等.应用多星多源数据组合动态监测黄河凌汛进程[J].人民黄河,2013,35(6):32-35.
[49] TIAN L, WAI O W H, CHEN X, et al. Retrieval of Total Suspended Matter Concentration from Gaofen-1 Wide Field Imager (WFI) Multispectral Imagery with the Assistance of Terra MODIS in Turbid Water-Case in Deep Bay[J]. International Journal of Remote Sensing, 2016, 37(14): 3400-3413.
[50] 石爱业,徐立中,杨先一,等.基于神经网络-证据理论的遥感图像数据融合与湖泊水质状况识别[J].中国图象图形学报,2005,10(3):372-377.
[51] 段广拓.基于多源遥感数据的水环境参量反演算法研究与应用[D].深圳:中国科学院大学,2019:8-18.
[52] 刘纯宇.基于多源遥感影像数据融合的巢湖水华时空动态反演[D].合肥:安徽农业大学,2019:6-9.
[53] 江辉.基于多源遥感的鄱阳湖水质参数反演与分析[D].南昌:南昌大学,2011:7-13.
[54] CHANG N B, BAI K, CHEN C F. Integrating Multisensor Satellite Data Merging and Image Reconstruction in Support of Machine Learning for Better Water Quality Management[J]. Journal of Environmental Management, 2017, 201: 227-240.
【责任编辑 吕艳梅】