基于数据分析的PM2.5浓度预测模型研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:gzhguozhihong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今,伴随着我国经济迅猛发展,工业、交通、服务业等诸多方面为人们生活带来了极大物质需求。同时,人口密集、工业聚集和交通过载等因素,导致许多城市空气污染极为糟糕。其中,雾霾天气在多地集中爆发,严重危害人们生活与环境,而PM2.5已经成为空气污染主要因素之一。因此,了解PM2.5浓度变化规律、污染等级及影响因素,建立PM2.5浓度预测模型,能够为人们生活和环境管理部门提供参考依据。本文以北京工业大学监测站采集数据为实验样本,运用统计方法对不同季节、逐时PM2.5浓度变化规律以及相关影响因素进行研究,为选取合适模型输入变量奠定理论基础,同时采用机器学习方法建立预测模型,对大气中PM2.5浓度进行预测。本文主要研究内容如下:1.根据搜集历史数据,分析PM2.5浓度不同季节和逐时变化规律。研究结果表明,秋、冬两季PM2.5浓度较高,并且表现为夜间明显高于白天趋势。同时,为了寻找可靠模型输入变量,从污染物和气象因子角度出发,对大气中PM2.5浓度相关影响因素进行相关性研究。研究结果表明,PM2.5与PM10、NO2、SO2以及温度呈强正相关性,而与相对湿度呈强负相关性。因此,在建立PM2.5浓度预测模型过程中,应该充分考虑PM10、NO2、SO2以及温度、相对湿度对大气中PM2.5浓度影响。2.提出基于BPAdaboost神经网络的PM2.5浓度预测模型。首先,运用灰色关联分析方法移除冗余变量;然后,运用粒子群算法(Particle Swarm Optimization,PSO)对BPAdaboost神经网络权值阈值进行寻优;最后,通过仿真实验分析,该模型预测性能要优于其它几种预测模型。然而,通过对原始PM2.5浓度和仿真结果进行研究后发现,PM2.5浓度有着高度不确定和非平稳特点,PM2.5浓度在某些时刻可能会存在突变,单模型预测性能不够理想,导致预测误差较大,因此单一预测模型精度亟需改善。3.提出基于互补集合经验模态分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD)和多模型的PM2.5浓度预测模型。首先,针对PM2.5浓度具有较强非线性和非平稳性特征,采用CEEMD方法对其进行分解;其次,分别建立四种单变量和多变量PM2.5浓度预测模型;然后,通过自适应权值调整策略,得到最终PM2.5浓度预测结果;最后,进行仿真实验分析,该模型预测精度明显优于各单一预测模型。然而,所提出模型需要分别对各IMF(Intrinsic Mode Function,IMF)进行单独预测,具有一定计算复杂度,并且PM2.5浓度存在较强随机性,期望包含更多不确定性信息。因此,针对上述所存在问题,本文将继续研究PM2.5浓度区间预测模型。4.提出基于Elman神经网络(Elman Neural Network,ENN)的PM2.5浓度区间预测模型。首先,针对上述建模过程中存在计算复杂度较高问题,利用样本熵(Sample Entropy,SE)对其进行优化,从而减小在建模过程中复杂度;其次,对区间预测模型质量评价指标做出阐述,并提出一种新颖的优化准则PSO算法,对Elman神经网络权值β和阈值b进行寻优;然后,建立基于多输入双输出Elman神经网络的PM2.5浓度预测模型,实现PM2.5浓度区间预测;最后,仿真结果表明,与ENN和CEEMD-SE-ENN相比,CEEMD-SE-PSO-ENN能够显著地提高预测结果可靠性和有效性。
其他文献
近年来,我们进行了新疆北鲵的室外和室内的人工驯养和繁殖研究,成功地繁殖出了新疆北鲵。研究表明,新疆北鲵繁殖期为4-6月,产卵和胚胎发育水温在8-14℃,历时40—46天,胚胎和胚后发育
目的评估双源CT在冠状动脉支架置入术后再狭窄诊断的准确度,评价其在支架置入术后复查中的临床随访价值。方法采用西门子SOMATOM Definition双源CT(DSCT)对42例冠状动脉支架
我国规模化养猪业的快速发展和土地流转制度的制约导致养殖业严重分离。养猪户为了最大限度地追求利润,使用兽药和添加剂而过度,导致出现大量兽药和重金属残留很难把肥料还田
据民政部2017年8月4日公布的2016年社会服务发展统计公报显示,截至2016年底,全国60岁及以上老年人口23086万人,占总人口的16.7%,中国社会当前面临着巨大的养老压力,从养老需
<正>经过十余年的持续宣讲和积极推动,关于科技金融的概念、机制、关系和政策的各种期刊文章与研究报告早已是汗牛充栋,相关的中央和地方支持政策也一直在接连不断地出台创新
2010年1月12日,在外交部举行的例行记者会上,发言人姜瑜以异乎寻常的平静道出了石破天惊的消息:“1月11日,中国在境内进行了一次陆基中段反导拦截技术试验,试验达到了预期目的”
报纸
研究目的:探讨缺血性中风(中经络)急性期证型及其他因素与血管性痴呆的相关性,为血管性痴呆的早期预防寻找新思路。研究方法:纳入2018年1月至2018年12月在重庆市北碚区中医院门诊及住院部就诊的急性缺血性中风(中经络)病人共300例,进行中医辩证分型,并收集相关临床资料,12周后随访患者,根据诊断标准记录所有患者是否发生血管性痴呆,运用软件SPSS 24.0对数据进行统计整理,采用Logistic
<正>原发性肾病综合征是一组由多种原因引起的肾小球基底膜通透性增加,导致血浆内大量蛋白质从尿中丢失的临床综合征[1],以大量蛋白尿、高血脂、低蛋白血症以及不同程度水肿
日常生活对儿童数学能力的培养具有重要作用。在非明确数学的情境下,个体对某一情境中数学方面的注意和识别倾向存在很大程度不同。近年来,研究者将个体对环境中数学相关的认
肿瘤是目前危害人类最主要的疾病之一,是一类与基因有关的遗传性疾病,在肿瘤发生、演进过程中常伴随有表观遗传学的改变,如:DNA甲基化、组蛋白修饰、染色质重塑、非编码RNA等