疫情期间大气污染物变化趋势

来源 :科学导报·学术 | 被引量 : 0次 | 上传用户:xdh188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘  要:2020年初,中国面临新型冠状病毒(COVID-19)的威胁,为了对抗突然爆发的疫情,中国大陆地区采取了积极的应对措施,其中包括持续数十日的个人隔离与城市隔离【1】,隔离期间,工业、交通等设施停止或以低功率运行,企业暂缓复工,大范围的交通出行降低,对于大气质量有一定的影响,本文以盐城市近年的前三月的相关空气质量评价指标的数据为基础,运用R语言进行处理,从而获得疫情对于大气污染的直观影响。
  关键词:大气污染;R语言
  1:介绍
  对于大气质量的评价常常有PM2.5、PM10、SO2等指标,其数据量较大处理过程较为繁琐,并且AQI指数只适合用来表征短期内的空气质量【2】,且考虑到AQI指数在处理颗粒物时所暴露的问题,所以对于分析拥有较大的时间跨度的大气质量变化,R语言是一个很好的工具。R语言【3】(The R Programming)诞生与1980年左右,其前身为贝尔实验室开发的S语言,目前R语言(以下简称R)广泛的用于统计计算、统计画图等领域,由于R开源且具有丰富的程序包,在处理大气污染相关的数据时具有速度快、操作简单、分析准确等其他软件不及的优势。
  本文将以盐城市近五年前三个月的PM2.5、PM10、SO2、CO、NO2以及O3的浓度作为基础数据,并运用到R中包含的“ggplot2”、“OpenAir”、“stats”、“randomForest”程序包進行分析,同时本文将具体的探究R语言在执行环境数据时的使用,并不涉及基础的R的使用知识。
  2:方法过程
  大气污染的数据来自https://www.aqistudy.cn/,导入数据的方法有很多,可以将网页中的表格复制到Excel中,再将其导入到R或者可以使用“rvest”包进行网络爬虫直接读取数据,由于爬虫的代码相比于前者较为复杂所以我们采取第一种方法即读取Excel文件,R自带的函数只可以读取以“.csv”为后缀的文件所以我们此时需要加载“openxlsx”包才可以读取以“.xlsx”为后缀的文件,代码如下图【图1】。
  将数据导入后可以先对原始数据做初步处理,我们先以时间为依据将数据分组进行处理,得到各个污染物数值的分布,分布图与代码见下图【图2】。
  根据上述图像我们可以看出,2020年一、二、三月份的污染物浓度同前四年相比散点的位置较接近X轴,说明污染物的浓度低于前四年所测的数据,从直观上观测我们可以得出污染物浓度降低,大气质量改善的结论,但是从科学的角度来说这种初步的、定性的结论是粗糙的,下面我们将进一步的从定量的角度来说明这一变化。
  我们采用t-检验来比较2020年的数据与其他四个月份的区别 ,一般的t-检验需要考虑两样本的方差是否相等,在这里我们采用Welch两样本t-检验来检验不同方差的样本来节约分析时的工作量【4】,由于t-检验要求只有两类样本所以我们依据年份将数据分为a组(年份为2020)和b组(年份为2020年以外的年份)来运行t-检验,得到的结果与相关的代码如下图所见【图3】。
  t-检验显示各污染物的p值全部超过0.05,在统计学上及认为此次假设不具备显著性【5】,表明2020年污染物数据与其他年份存在显著性差异即2020年大气质量的平均水平与往年同时段的平均水平存在差异,同时从t检验所示的各污染物平均数据可以看出2020的污染物平均水平低于其余年份,所以从我们从统计的角度可以初步确定2020年大气质量优于往年,但是由于数据选取的不足,我们难以排除偶然因素的影响,所以对于数据我们将做进一步的处理,这里我们要介绍一种统计学和机器学习中的新的模型——随机森林【6】(randomForest),随机森林是指利用多棵决策树对样本进行训练并预测的一种分类器,在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。Leo Breiman和Adele Cutler发展出推论出随机森林的算法。而 "Random Forests" 是他们的商标。这个术语是1995年由贝尔实验室的Tin Kam Ho所提出的随机决策森林(random decision forests)而来的。这个方法则是结合 Breimans 的 "Bootstrap aggregating" 想法和 Ho 的"random subspace method"以建造决策树的集合。关于随机森林的原理由于和本文无关就不做过多的说明了,我们需要了解的是随机森林在处理大量的变数以及在内部对于一般的化后的误差产生不偏差的估计时具有很大的优势,所以在本文我们选取随机森林为进一步处理的模型,首先我们根据六类污染物的浓度做加和运算,用得到的数据来表示大气质量的优劣程度,在选择判断数时我们参考AQI的计算方法得到AQI为优情况下各污染物浓度并考虑到盐城市本地全年的平均大气质量,我们将判断数设为217,当加和得到的数小于217时我们认为大气质量为优(用T表示),反之则为劣(用F表示),这样我们的原始数据就完成了二分类的改造,将其用于随机森林的模型之中,需要注意的是由于我们改变了原始数据所以我们需要重新导入数据,同时由于随机森林在标签变量为numeric与factor时执行的分别为回归与分类,所以我们还需将标签数据转变为factor类型,确定执行的为分类时我们还需将原始数据分为训练数据与测试数据,我们先用训练数据运行随机森林接着用测试数据对模型进行预测从而判断分类的准确性,当这些前期工作都就绪时我们就可以执行随机森林分类了,运行后的结果与运行代码如下图所见【图4】【图5】【图6】。
  图4表明在大气质量为劣的分组中我们认为进行的分组与随机森林进行的分类相比误差在0.003349282,而在大气质量为优的分组中错误率为0.03703704,我们进行的分类与机器进行的分类误差在5%以内,这表明我们进行的分类具有较强的准确性,与测试数据的对比也证明了这一点,此时通过进一步的数据处理我们将数据误差控制在了5%以内,基本排除了由于数据偶然性造成的误判,剩余的工作就非常的简单了,我们只需统计出2020年份中T的占比并将其与其他年份T的占比进行比较,这一需求在其他软件中也可以简单的实现,在这里我们还是使用R进行处理,结果及代码如下图所示【图7】。   我们可以看出2016——2019四个年份中质量为T的天数为98约占总数的0.2715,2020年质量为T的天数为57约占总数的0.6264,后者约为前者的三倍,至此我们可以从定量的角度得到结论,疫情期间大气质量有较好的改善。
  3:解释与思考
  大气中污染物的类型大致有两种,即煤烟型与交通型,前者的主要污染物为二氧化硫、氮氧化物、悬浮物、PM0、一氧化碳,后者的污染物主要有氮氧化物、有机物,这两种不同的污染类型所发生时间也不同,前者多发生在冬季,后者发生于夏季,本次分析选取的数据除臭氧外都为煤烟型污染物且因为疫情发生在冬季所以同其他年份同时段的数据相比有较为明显的改善,而由于低空臭氧的产生往往都是由交通型污染产生的光化学烟雾二次反应生成的,所以在交通型污染不占主导的情况下,臭氧的数据与往年同时段相比,差异较之其他污染物略微不明显。
  与此同时在本实验中没有采用比较AQI的数值来判断的原因有如下几点:首先前文中已经提到在比较长时段的数据时缺少精确度,其次如上文所讲因为缺少夏季的数据所以臭氧的数据缺少显著的差异,所以在进行AQI的计算中时某些情况下AQI数值也缺少显著的差异。
  在某些方面该分析存在一定的问题,首先受限于人力与物力本次分析采用的数据虽然在时间上有一定的跨度但是在空间少缺少相应的跨度,仅仅考虑了盐城市的大气质量,本文的结论在全国范围内能否成立还需要进一步的验证。同时在做最后大气质量的优劣时仅仅对各项数据进行加和处理,而没有考虑到具体污染物的比重问题,这在经一步的探究时需要改进。
  本次疫情对于全国乃至全球都是一个严峻的挑战,我们为此次战疫付出了许多,但是作为一名环境科学的研究者来说,我们很高兴的看到大气质量得到了改善,虽然这次改善牺牲了部分经济水平,但是我们发现了以前困扰我们许久的大气问题并不再是一味的變坏或者是维持原状,而是有了提高的可能性,下一步我们要做的就是在经济和环境之中找到一个更好的平衡点。
  4:总结
  在疫情期间,由于工厂的停工以及交通运输的低功率运行,在冬季占主导作用的煤烟型污染与不占主导的交通型污染收到抑制,使大气质量得到有效的提高,同时对于进一步探究人类活动(主要为经济活动)与环境关系提出了思考。
  参考文献
  [1]  人民日报http://society.people.com.cn/n1/2020/0123/c1008-31561292.html
  [2]  百度百科https://baike.baidu.com/item/AQI/463245?fr=aladdin
  [3]  百度百科https://baike.baidu.com/item/R语言
  [4]  贾里德·P·兰德.R语言实用数据分析和可视化技术[M]208-209
  [5]  浙江大学,盛骤,谢式千等.概率论与数理统计[M]178-182
  [6]  百度百科https://baike.baidu.com/item/随机森林
其他文献
摘 要:公众参与能够反映民意,有利于提高政策的执行力,能使政策及时有效进行调整,适应实践之需要。但目前实践中存在公众参与度不高,参与途径不多等问题,对此,笔者认为,应以安徽省安庆市宜秀区为参考,认真做好宣传工作,提高公众参与意识;同时完善相关制度,明确各级各单位责任,优化扶贫流程;畅通反映意见的渠道,通过听取公众意见提高公众参与度,确保精准脱贫真正达到实效。  关键词:精准扶贫、公众参与、制度保障
期刊
摘 要:随着我国经济的不断发展,现代工业生产技术也迎来了爆发式增长,在产品质量和结构安全性的需求上也越来越高。由于生产技术的需求,无损检测技术的应用也越来越多,在检测压力容器方面方法很多,而磁粉检测技术检测灵敏度高,效率高且成本低,在压力容器检测过程中被广泛应用。本文通过对磁粉检测的原理出发,分析了磁粉检测的优缺点并且提出了相应的应用方法。  关键词:磁粉检测;压力容器检验;应用  一、磁粉检测的
期刊
摘 要:烧结普通砖是房屋建筑工程施工的重要材料,其质量深刻影响整个房屋建筑工程的施工质量。为此,文章结合烧结普通砖的基本特点,就烧结普通砖的检测技术应用问题进行探究,旨在能够更好的提升烧结普通砖的使用质量。  关键词:烧结普通砖;建筑工程;强度检测;检测质量  烧结普通砖一直是我国建筑的关键材料之一,科学精准地对其强度进行检测,是建筑领域必备的一项重要技能。从组织构成上来看,烧结普通砖主要由黏土、
期刊
摘 要:“跷脚牛肉”是乐山饮食的著名品牌,是乐山市级非物质文化遗产,其历史可以追溯到上世纪三十年代,距今近百年。乐山独特的历史、经济、文化环境造就了“跷脚牛肉”,而“跷脚牛肉”也正好体现了独特的乐山文化,从中也可以看出我们对“非遗”的保护与传承。对于“跷脚牛肉”的研究,研究人员较少,系统论述的文献更少。此文从“跷脚牛肉”的历史起源、饮食文化、闲适文化、发展现状以及它的未来展望五个方面进行论述。  
期刊
摘 要:本文运用文献资料法、专家访谈法、问卷调查法、实验法和数理统计法对运动与饮食减肥进行研究,并将新方案与人们常用的两种减肥方法进行比较分析。其结果显示:新方案与人们常用的两种减肥方案相比,减肥效果明显,并且对人体的机能水平和心理状态有着积极的影响,可操作性强,易于推广。  关键词:新时代;减脂;饮食;运动  引言  如今“减肥”成为了现代人口中的热词。然而一味的盲目减肥不仅不会起到减肥的效果,
期刊
摘 要:我国的治国方略需要促进法律的建设工作,只有这样才能够确保国家的建设稳定和繁荣。当今时代是法制时代,而我国的所有公民都要坚持遵纪守法的原则,而党员是党的生力军和后备军,党员与入党积极分子应更好的强化自身法制教育的工作和学习,全方面的落实党的方针和教育政策。在基层进行党校的档案法制建设时目前还存在着一定的问题,对相关问题进行总结分析有效的策略,能夠促进基层党校档案法制建设工作的进步和发展。本文
期刊
摘 要:当前,全球创客运动正在蓬勃发展。我国部分中小学校已在创客教育的路上迈出了探索的步伐。中小学信息技术教师应该充分利用积木式编程工具,如Scratch编程软件结合电子积木套件,提高学生的动手能力、逻辑思维能力、解决问题能力。学生在使用Scratch创作作品时经历想象——创造——游戏——分享——反思的过程,是创新意识的培养过程。此外,Scratch操作简单,趣味性强又能有效地训练学生的发散思维,
期刊
摘 要:对于电机及控制器的调试工作,以往主要依赖于串口调试的预先写入的数据帧测试用例与传统编程语言编写的上位机。前者在调试环节需要人为换算十六进制数据且缺少实时性;后者的软件开发周期较长,对于不同控制器产品,程序不易改写。本文设计了一种基于LabVIEW平台的调试系统,并使用电机及控制器产品搭建调试平台进行验证。测试结果表明,该调试系统具有模拟实际工况好、方便易用、改写容易等优点,还可以对控制器的
期刊
摘 要:当前,包括污水治理、医药制备、食品加工等多个行业均对纤维素酶有一定的使用需求,为了促使其期能够在食品加工行业得到更为广泛以及充分应用,本文对纤维素酶的作用机制以及应用进行深入分析,以期对相关单位有所帮助。  关键词:纤维素酶;食品加工;发酵  引言  纤维素酶有着非常优越的木聚糖酶活力,是较为常见的复合酶类型之一。经过分析包括葡萄糖内切酶、外切酶以及B-葡萄糖苷酶等均是其重要构成成分。目前
期刊
摘 要:本文根据油田地面建设工程监督工作实际,着重分析了油田地面建设工程监督机构专业化重组改革前后的对比,改革前主要负责质量监督,改革后实施质量、安全、环保一体化监督,取得了明显的监督效果。  关键词:油田地面建设工程;QHSE监督;一体化监督  油田地面建设工程包括石油天然气建设工程和石油矿区建设工程,涉及土建、安装、电气、道路、市政、水工等多个学科专业,具有工程规模大、施工周期长、涉及领域多、
期刊