论文部分内容阅读
近年来我国中东部地区出现了严重的灰霾污染问题,引起公众广泛关注。PM2.5是造成灰霾天气的主要污染物,影响着环境、空气质量和公众健康等。衡量PM2.5暴露的健康风险,开展模拟与预报研究,对排放来源进行追溯,都需详尽的地表PM2.5浓度时空数据支持。传统的站点观测时间分辨率高、结果较准确,但建站成本高、测站分布稀疏不均、监测空间范围有限;此外,不同算法反演的气溶胶光学厚度(AOD)产品精度和数据量的协调及使用不充分;一些简单的统计方法反演精度较低且建模数据种类和数量较局限。这些问题都限制了PM2.5的研究应用。为解决上述问题,本研究综合利用京津冀地区2015年逐小时PM2.5地面监测数据、GEOS气象模式数据以及最新发布的搭载于美国Terra和Aqua卫星上的MODIS第6版融合暗目标算法(DT)和深蓝算法(DB)的气溶胶相关参数,基于广泛使用的多元线性回归方法及机器学习算法(包括回归树、随机森林、支持向量机),分别建立了两卫星在研究区内的PM2.5统计模型。同样的训练和测试数据集以及模型方法分别用于TERRA和AQUA相应卫星数据集使其具有可比性,利用10重5折交叉验证方法对比各模型的合理性及估算能力。结果表明,AQUA对应数据集在所选四个模型上的表现性能均比TERRA数据集好,本研究首次应用于该领域的随机森林(RF)算法在验证集和独立测试集上均在四种模型中最好(TERRA:CV R=0.767,RMSE=43.512;AQUA:CV R=0.843,RMSE=33.904),再加上该算法本身的一些优势,可认为RF算法用于提高地表PM2.5估算具有较高可行性。应用最优模型——RF算法反演了每日地表PM2.5浓度,随机选择三个站点对该数据集进行时间序列分析验证得到了较高的相关性。同时,对应于MODIS卫星过境时刻选择相应的站点观测数据,使用克里金方法得到基于地统计插值的PM2.5浓度,比较两种数据集的估算差异,并探究研究区PM2.5的上、下午及季节平均浓度空间分布情况和变化特征。研究表明,RF模型可改善PM2.5反演存在的低值高估和高值低估现象,有效提高了反演精度;反演影像空间覆盖连续、精细,基本能准确反映出研究区PM2.5的空间分布,但由于AOD缺失过多,季节变化特征存在问题。本研究为PM2.5反演提供了新方法,研究数据集可为相关应用提供参考。