论文部分内容阅读
当今,伴随着我国经济迅猛发展,工业、交通、服务业等诸多方面为人们生活带来了极大物质需求。同时,人口密集、工业聚集和交通过载等因素,导致许多城市空气污染极为糟糕。其中,雾霾天气在多地集中爆发,严重危害人们生活与环境,而PM2.5已经成为空气污染主要因素之一。因此,了解PM2.5浓度变化规律、污染等级及影响因素,建立PM2.5浓度预测模型,能够为人们生活和环境管理部门提供参考依据。本文以北京工业大学监测站采集数据为实验样本,运用统计方法对不同季节、逐时PM2.5浓度变化规律以及相关影响因素进行研究,为选取合适模型输入变量奠定理论基础,同时采用机器学习方法建立预测模型,对大气中PM2.5浓度进行预测。本文主要研究内容如下:1.根据搜集历史数据,分析PM2.5浓度不同季节和逐时变化规律。研究结果表明,秋、冬两季PM2.5浓度较高,并且表现为夜间明显高于白天趋势。同时,为了寻找可靠模型输入变量,从污染物和气象因子角度出发,对大气中PM2.5浓度相关影响因素进行相关性研究。研究结果表明,PM2.5与PM10、NO2、SO2以及温度呈强正相关性,而与相对湿度呈强负相关性。因此,在建立PM2.5浓度预测模型过程中,应该充分考虑PM10、NO2、SO2以及温度、相对湿度对大气中PM2.5浓度影响。2.提出基于BPAdaboost神经网络的PM2.5浓度预测模型。首先,运用灰色关联分析方法移除冗余变量;然后,运用粒子群算法(Particle Swarm Optimization,PSO)对BPAdaboost神经网络权值阈值进行寻优;最后,通过仿真实验分析,该模型预测性能要优于其它几种预测模型。然而,通过对原始PM2.5浓度和仿真结果进行研究后发现,PM2.5浓度有着高度不确定和非平稳特点,PM2.5浓度在某些时刻可能会存在突变,单模型预测性能不够理想,导致预测误差较大,因此单一预测模型精度亟需改善。3.提出基于互补集合经验模态分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD)和多模型的PM2.5浓度预测模型。首先,针对PM2.5浓度具有较强非线性和非平稳性特征,采用CEEMD方法对其进行分解;其次,分别建立四种单变量和多变量PM2.5浓度预测模型;然后,通过自适应权值调整策略,得到最终PM2.5浓度预测结果;最后,进行仿真实验分析,该模型预测精度明显优于各单一预测模型。然而,所提出模型需要分别对各IMF(Intrinsic Mode Function,IMF)进行单独预测,具有一定计算复杂度,并且PM2.5浓度存在较强随机性,期望包含更多不确定性信息。因此,针对上述所存在问题,本文将继续研究PM2.5浓度区间预测模型。4.提出基于Elman神经网络(Elman Neural Network,ENN)的PM2.5浓度区间预测模型。首先,针对上述建模过程中存在计算复杂度较高问题,利用样本熵(Sample Entropy,SE)对其进行优化,从而减小在建模过程中复杂度;其次,对区间预测模型质量评价指标做出阐述,并提出一种新颖的优化准则PSO算法,对Elman神经网络权值β和阈值b进行寻优;然后,建立基于多输入双输出Elman神经网络的PM2.5浓度预测模型,实现PM2.5浓度区间预测;最后,仿真结果表明,与ENN和CEEMD-SE-ENN相比,CEEMD-SE-PSO-ENN能够显著地提高预测结果可靠性和有效性。