论文部分内容阅读
摘要: 本文搜集了2013年12月至2014年2月 的浓度观测数据以及同步气象数据,分析了冬季 质量浓度日变化趋势和小时变化趋势,以及 浓度日变化特征与气象因素的关系。86天内 质量浓度均值为 ,有58天日均值浓度超过 ,最长持续天数为16天。 质量浓度小时变化明显呈现为三个阶段,且与人类生产生活活动有着密切的联系。 质量浓度与风速呈現出明显的负相关关系,并且在 质量浓度越高时候, 质量浓度与风速的相关性越高。 质量浓度与相对湿度呈现出较明显的正相关关系。 质量浓度与温度的无明显相关关系。最后用Arcgis和ENVI相关软件对分析结果进行了简单的数据可视化表达。
关键字: ; 相对湿度;风速;数据可视化
引言
中文名称为细颗粒物,是指环境空气中空气动力学当量直径小于等于 2.5 微米的颗粒物。它能较长时间悬浮于空气中,其在空气中含量浓度越高,就代表空气污染越严重。 粒径小,面积大,活性强,易附带有毒、有害物质(例如,重金属、微生物等),且在大气中的停留时间长、输送距离远,因而对人体健康和大气环境质量的影响较大。近年来有关 的研究愈发引起社会各界的广泛关注。2003年杨复沫等人第一次提出了对北京大气中微量元素的浓度变化特征与来源的分析,重点研究了 中各微量元素浓度及其来源,而对大气中 浓度变化特征与气象因素的关系没有研究。2006年梁明易等人提出了广州地区 污染特征分析的研究。但针对北京地区 浓度变化特征以及与气象因素的研究不多。
数据可视化是关于数据之视觉表现形式的研究。在数据挖掘、分析出来之后,如果呈现一串数据或者一个表格,这样的结果难以吸引用户,因此,将数据进行可视化展现,让数据生动起来,使用户对分析出的重要信息拥有直观感受,可以帮助用户更加方便快捷的获取重要信息。2008年加拿大安大略省约克大学的心理学教授,以及统计学顾问服务部(Statistical Consulting Service)的副协调员迈克尔?路易斯?弗兰德利做了相关的大量研究。因此本文对2013年12月至2014年2月大气数据的基础上展开了对污染特征以及与气象因素关系的分析并将结果进行简单的数据可视化表达。旨在提高人们对于 传播特点的认识,同时有助于政府做出正确的决策来展开相应的防治改善工作。
一、数据获取
本文从网站信息等来源上收集了2013年12月5日至2014年2月28日每日0时至23时的 质量浓度数据共10406条;从中国科学院国家空间科学中心数据网络技术实验室收集了此期间共计86天的气象数据(包括日平均风速、平均气温以及平均相对湿度)。在此基础上对数据进行描述、预处理和挖掘分析。
二、数据描述、预处理与挖掘分析
(一)描述冬季 质量浓度日变化特征
由图1可见,在2013年12月5日至2014年2月28日期间, 浓度日均值大多时候在0-150之间,只有少数几天波动较大。共计86天内,均值为 ,最大值为 。有58天日均值浓度超过 ,超过1996年美国环保局规定的浓度日均值标准。在图1中可见有几个波动较大区间:12月6日至12月7日,2月11日至2月13日,以及2月22日至2月25日,此三段时间内 浓度日均值明显上升,日均值浓度均高于 。伴随着较低的平均风速水平( ,平均风速 )和较高的平均相对湿度(50%-74%,平均相对湿度为46%),有利于气态污染物直接转化为二次粒子,进而导致较高的 浓度;12月09日至12月12日,12月26日至12月28日,1月20日,2月3日,2月9日以及2月27日,都呈现了较低水平的 浓度,结合其平均风速和相对湿度数据来看,在此期间内较高风速和较低的相对湿度水平,使得污染物扩散较为充分致使勘测的 浓度水平较低。
(二) 描述冬季 质量浓度小时变化特征
在数据期间共计86天内,有58天 浓度高于,即超过了美国环保局规定的 浓度日均值标准,因此本文着重选取此58天内数据分析,选取此阶段 中高浓度持续最长天数(16天)的2月11日至2月26日分析。此16天内各小时 浓度变化趋势的高度相似的,其 浓度从0时至23时逐时平均值的变化趋势见图2。
由图2可知在 浓度持续较高的16天内,各时刻 浓度平均值均呈现较高水平( ),各时刻 浓度平均值的变化趋势也是较为明显的。从23时至次日8时, 平均小时浓度持续下降,结合人类活动时间来看,主要是由于各类产生细颗粒物的工厂排放及劳作活动在此时间段停止或减少的原因。在8时至16时呈现平稳波动状态,因为此时段细颗粒物污染源排放逐步趋于稳定,大气混合层抬高,细颗粒物垂直方向扩散强烈,以至于污染物在大范围内混合扩散,细颗粒物浓度变化波动较小,呈现出平稳波动状态。从12时以后至23时,由于是细颗粒物污染排放量较大时段,导致 平均小时浓度呈现出逐渐上升趋势。由此可见 平均小时浓度的变化呈现先下降,中间平稳,后上升的特点,并且与人类生产活动有着密切联系。
(三)数据的预处理
在数据挖掘分析前,我们筛选出北京各地PM2.5测量值完整的数据,过滤掉时间重复数据,清除了异常数据。
(四)挖掘与分析: 质量浓度与气象因素关系
1、 质量浓度与日平均风速关系
首先在日平均浓度变化趋势的分析时我们已经知道, 质量浓度与风速呈现负相关关系,即风速越大, 质量浓度越容易呈现低水平状态。在此基础上本文利用SPSS21.0计算86天内 日平均质量浓度与平均风速的相关系数,见表1。
系数为-0.521,呈现明显的负相关关系。但是 质量浓度与平均风速的相关系数变化趋势与 质量浓度的关系如何呢?本文以5日为一个单位计算 质量浓度与平均风速的相关系数,共得到82组相关系数值,以反映 质量浓度与风速的相关系数随时间的变化趋势。82组相关系数散点分布见图3。 由图3可知, 质量浓度与平均风速的相关系数大多分布在-0.6至-1之间,但其分布是不完全均匀的,即平均风速对 质量浓度的以影响是不完全相同的。在此基础上,对数据进行归一化处理,利用公式 对 质量浓度与相关系数分别进行归一化处理,并绘制相关系数与 质量浓度变化趋势图,如图4。
如图4可知,平均风速对 质量浓度的影响是随着 质量浓度的高低变化而呈现较为一致的变化趋势的。即当 质量浓度越大时,平均风速对 质量浓度的影响越大,二者间的相关系数越大;当 质量浓度下降时,平均风速对 质量浓度的影响也降低,二者间的相关系数也变小。
2、 质量浓度与相对湿度关系
利用SPSS21.0计算出的86天内 质量浓度与相对湿度间的相关系数为0.74。表现出 质量浓度与相对湿度具有明显的正相关关系,即相对湿度越大, 质量浓度越大。即较高的大气湿度有利于气态污染物直接转化为二次粒子,进而导致较高的 浓度。
3、 质量浓度与温度关系
首先计算86天内 质量浓度与温度间的相关系数为0.15。其次以5日为一个单位,计算 质量浓度与温度间的相关系数结果图5所示。
由图5可见, 质量浓度与温度的相关系数分布均匀的分布在-1到1之间,由此可见 质量浓度与温度的相关性并不具有集中分布的特点和一致的趋势,可见 质量浓度与温度并无较直接的相关性。
三、结论
首先通过对 质量浓度的日变化趋势分析可以看出,冬季 质量浓度普遍呈现较高水平。在所选86天内, 质量浓度均值为 ,单日平均浓度最高為 。有58天日均值浓度超过 ,超过1996年美国环保局规定的浓度日均值标准。连续日均值浓度超过 的最长持续天数为16天,结合相对湿度和能见度数据来看,这一时期的雾霾天气持续时间较长,空气质量较低。
其次在对 质量浓度的小时变化趋势分析可以看出, 质量浓度具有明显的小时变化,且与人类生产生活活动有着密切的联系。从0时至23时, 质量浓度变化呈现三个阶段:首先是0时至8时,伴随着工业污染物排放量的下降而呈现的 质量浓度下降阶段;其次是8时至17时的较为平稳的波动状态;最后是17时至23时,由于人类活动原因和气象因素原因而变现出的持续上升阶段。
最后是对 质量浓度与气象因素关系的分析:首先 质量浓度与风速呈现出明显的负相关关系,即风速越大呈现出较低水平的 质量浓度。并且在 质量浓度越高时候, 质量浓度与风速的相关性越高,风速变化对于 质量浓度的影响程度越大;其次是 质量浓度与相对湿度呈现出较明显的正相关关系,即相对湿度越大,呈现出较高的 质量浓度监测值。最后是 质量浓度与温度的无明显相关关系的结论。
四、数据可视化
(一)数据可视化的定义
根据2008年迈克尔?路易斯?弗兰德利在文献中的定义:数据可视化是关于数据之视觉表现形式的研究。其中,这种数据的视觉表现形式被定义为一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。
(二)数据可视化的目的
所有数据的分析、挖掘,其最终目的是将信息呈现给用户。所以数据的可视化,是最终面对用户的,是让用户可以体验到所有的设计,感受数据之美,但背后大量单调的数据,用户看不到。
(三)数据可视化的原则
可视化不是自己通过想象去展现,在互联网上有着各式各样的图形,以最基础的图形要素为主。因为最基础的图形要素表达信息最准确,也最为直观,用户可以很容易理解它要表达的内容。
对图形元素进行组合、展现时,应确保图形的表达准确,分类合理。图形基本元素众多,长短、倾斜度可体现数据变化,图形大小、明暗度、色彩、形状等都可进行可视化展现。通过高矮可以区分数量大小,通过颜色可以区分类别。要想将最重要的信息传递给用户,相应的坐标图、说明文字、分类都是非常重要的。
(四)数据可视化的流程
数据可视化包含许多步骤:数据获取、数据描述、数据的预处理、数据挖掘与分析、数据呈现、数据改善、数据交互。其中,在使用已有软件时无法完成最后的数据交互这一步,若是由编程代码实现的数据可视化则可以完成最后的数据交互。我们是基于已有软件对 质量浓度特征结果的简单数据可视化,没有完成数据交互这一步。
(五)数据呈现
基于本文所做的数据获取、描述、预处理和挖掘分析等操作,运用Arcgis相关软件制作了北京地形信息的三维立体展现和 与风速、温度关系的数据可视化。将北京冬季 质量浓度特征随时间变化结果进行简单的可视化表达,如下:
(六)数据改善决策
经过科学的数据分析与简单的可视化表达,我们可以看到 质量浓度与季节和温度无直接关系,若要降低 质量浓度,不仅要在冬季严防爆竹燃放,也要在夏季严防秸秆燃烧,对于排放烟尘的工厂应严格限定排放量,做到一年四季都从源头控制细颗粒物的排放。
五、本文优点与不足
本文优点首先在于采取了较新的数据,更加准确地反映了近期质量浓度的变化趋势特点。其次本文较为详尽地分析了质量浓度与气象因素的关系,并且引用了5日为一个周期,分析了质量浓度与气象因素相关性的变化特点。得出了质量浓度越大,质量浓度与风速相关性越大的结论。最后运用Arcgis、ENVI相关软件对分析结果进行了可视化表达,使得用户更加方便快捷直观的获取到分析结果的相关信息。
本文的不足之处是对于质量浓度的北京市的各地区没有进行差异性分析。另外对于分析质量浓度与气象因素相关性的变化特点时选用的5日为一个周期或许存在不尽完善之处。还有数据可视化的模型较为简单,直接利用已有软件进行可视化表达,没有完成最后的数据交互这一步骤,如果能够通过编写程序和代码会使该研究内容的的数据可视化更加精确,更加美观,希望在以后的研究中有所改进。
项目资助:大学生创新创业训练计划项目(校级A类:2014AX024)。
参考文献:
[1]戴海夏.大气PM2.5的健康影响. 国外医学(卫生学分册), 2001-09-25
[2]杨复沫.北京大气PM2.5中微量元素的浓度变化特征与来源. 环境科学,2003-11-30
[3]梁明易.广州冬季霾天气大气PM_2_5_污染特征分析.中国环境监测,2007-10-15
[4] 何平. 上海宝山地区大气PM_2_5_污染特征分析. 环境与职业医学,2010-12-25 [5]迈克尔?路易斯?弗兰德利. "Milestones in the history of thematic cartography, statistical graphics, and data visualization",2008
作者简介:
李莎莎(1994.8-),女,籍贯:内蒙古通辽市,中国地质大学(北京)信息工程学院地理信息系统专业2012级本科生。
关键字: ; 相对湿度;风速;数据可视化
引言
中文名称为细颗粒物,是指环境空气中空气动力学当量直径小于等于 2.5 微米的颗粒物。它能较长时间悬浮于空气中,其在空气中含量浓度越高,就代表空气污染越严重。 粒径小,面积大,活性强,易附带有毒、有害物质(例如,重金属、微生物等),且在大气中的停留时间长、输送距离远,因而对人体健康和大气环境质量的影响较大。近年来有关 的研究愈发引起社会各界的广泛关注。2003年杨复沫等人第一次提出了对北京大气中微量元素的浓度变化特征与来源的分析,重点研究了 中各微量元素浓度及其来源,而对大气中 浓度变化特征与气象因素的关系没有研究。2006年梁明易等人提出了广州地区 污染特征分析的研究。但针对北京地区 浓度变化特征以及与气象因素的研究不多。
数据可视化是关于数据之视觉表现形式的研究。在数据挖掘、分析出来之后,如果呈现一串数据或者一个表格,这样的结果难以吸引用户,因此,将数据进行可视化展现,让数据生动起来,使用户对分析出的重要信息拥有直观感受,可以帮助用户更加方便快捷的获取重要信息。2008年加拿大安大略省约克大学的心理学教授,以及统计学顾问服务部(Statistical Consulting Service)的副协调员迈克尔?路易斯?弗兰德利做了相关的大量研究。因此本文对2013年12月至2014年2月大气数据的基础上展开了对污染特征以及与气象因素关系的分析并将结果进行简单的数据可视化表达。旨在提高人们对于 传播特点的认识,同时有助于政府做出正确的决策来展开相应的防治改善工作。
一、数据获取
本文从网站信息等来源上收集了2013年12月5日至2014年2月28日每日0时至23时的 质量浓度数据共10406条;从中国科学院国家空间科学中心数据网络技术实验室收集了此期间共计86天的气象数据(包括日平均风速、平均气温以及平均相对湿度)。在此基础上对数据进行描述、预处理和挖掘分析。
二、数据描述、预处理与挖掘分析
(一)描述冬季 质量浓度日变化特征
由图1可见,在2013年12月5日至2014年2月28日期间, 浓度日均值大多时候在0-150之间,只有少数几天波动较大。共计86天内,均值为 ,最大值为 。有58天日均值浓度超过 ,超过1996年美国环保局规定的浓度日均值标准。在图1中可见有几个波动较大区间:12月6日至12月7日,2月11日至2月13日,以及2月22日至2月25日,此三段时间内 浓度日均值明显上升,日均值浓度均高于 。伴随着较低的平均风速水平( ,平均风速 )和较高的平均相对湿度(50%-74%,平均相对湿度为46%),有利于气态污染物直接转化为二次粒子,进而导致较高的 浓度;12月09日至12月12日,12月26日至12月28日,1月20日,2月3日,2月9日以及2月27日,都呈现了较低水平的 浓度,结合其平均风速和相对湿度数据来看,在此期间内较高风速和较低的相对湿度水平,使得污染物扩散较为充分致使勘测的 浓度水平较低。
(二) 描述冬季 质量浓度小时变化特征
在数据期间共计86天内,有58天 浓度高于,即超过了美国环保局规定的 浓度日均值标准,因此本文着重选取此58天内数据分析,选取此阶段 中高浓度持续最长天数(16天)的2月11日至2月26日分析。此16天内各小时 浓度变化趋势的高度相似的,其 浓度从0时至23时逐时平均值的变化趋势见图2。
由图2可知在 浓度持续较高的16天内,各时刻 浓度平均值均呈现较高水平( ),各时刻 浓度平均值的变化趋势也是较为明显的。从23时至次日8时, 平均小时浓度持续下降,结合人类活动时间来看,主要是由于各类产生细颗粒物的工厂排放及劳作活动在此时间段停止或减少的原因。在8时至16时呈现平稳波动状态,因为此时段细颗粒物污染源排放逐步趋于稳定,大气混合层抬高,细颗粒物垂直方向扩散强烈,以至于污染物在大范围内混合扩散,细颗粒物浓度变化波动较小,呈现出平稳波动状态。从12时以后至23时,由于是细颗粒物污染排放量较大时段,导致 平均小时浓度呈现出逐渐上升趋势。由此可见 平均小时浓度的变化呈现先下降,中间平稳,后上升的特点,并且与人类生产活动有着密切联系。
(三)数据的预处理
在数据挖掘分析前,我们筛选出北京各地PM2.5测量值完整的数据,过滤掉时间重复数据,清除了异常数据。
(四)挖掘与分析: 质量浓度与气象因素关系
1、 质量浓度与日平均风速关系
首先在日平均浓度变化趋势的分析时我们已经知道, 质量浓度与风速呈现负相关关系,即风速越大, 质量浓度越容易呈现低水平状态。在此基础上本文利用SPSS21.0计算86天内 日平均质量浓度与平均风速的相关系数,见表1。
系数为-0.521,呈现明显的负相关关系。但是 质量浓度与平均风速的相关系数变化趋势与 质量浓度的关系如何呢?本文以5日为一个单位计算 质量浓度与平均风速的相关系数,共得到82组相关系数值,以反映 质量浓度与风速的相关系数随时间的变化趋势。82组相关系数散点分布见图3。 由图3可知, 质量浓度与平均风速的相关系数大多分布在-0.6至-1之间,但其分布是不完全均匀的,即平均风速对 质量浓度的以影响是不完全相同的。在此基础上,对数据进行归一化处理,利用公式 对 质量浓度与相关系数分别进行归一化处理,并绘制相关系数与 质量浓度变化趋势图,如图4。
如图4可知,平均风速对 质量浓度的影响是随着 质量浓度的高低变化而呈现较为一致的变化趋势的。即当 质量浓度越大时,平均风速对 质量浓度的影响越大,二者间的相关系数越大;当 质量浓度下降时,平均风速对 质量浓度的影响也降低,二者间的相关系数也变小。
2、 质量浓度与相对湿度关系
利用SPSS21.0计算出的86天内 质量浓度与相对湿度间的相关系数为0.74。表现出 质量浓度与相对湿度具有明显的正相关关系,即相对湿度越大, 质量浓度越大。即较高的大气湿度有利于气态污染物直接转化为二次粒子,进而导致较高的 浓度。
3、 质量浓度与温度关系
首先计算86天内 质量浓度与温度间的相关系数为0.15。其次以5日为一个单位,计算 质量浓度与温度间的相关系数结果图5所示。
由图5可见, 质量浓度与温度的相关系数分布均匀的分布在-1到1之间,由此可见 质量浓度与温度的相关性并不具有集中分布的特点和一致的趋势,可见 质量浓度与温度并无较直接的相关性。
三、结论
首先通过对 质量浓度的日变化趋势分析可以看出,冬季 质量浓度普遍呈现较高水平。在所选86天内, 质量浓度均值为 ,单日平均浓度最高為 。有58天日均值浓度超过 ,超过1996年美国环保局规定的浓度日均值标准。连续日均值浓度超过 的最长持续天数为16天,结合相对湿度和能见度数据来看,这一时期的雾霾天气持续时间较长,空气质量较低。
其次在对 质量浓度的小时变化趋势分析可以看出, 质量浓度具有明显的小时变化,且与人类生产生活活动有着密切的联系。从0时至23时, 质量浓度变化呈现三个阶段:首先是0时至8时,伴随着工业污染物排放量的下降而呈现的 质量浓度下降阶段;其次是8时至17时的较为平稳的波动状态;最后是17时至23时,由于人类活动原因和气象因素原因而变现出的持续上升阶段。
最后是对 质量浓度与气象因素关系的分析:首先 质量浓度与风速呈现出明显的负相关关系,即风速越大呈现出较低水平的 质量浓度。并且在 质量浓度越高时候, 质量浓度与风速的相关性越高,风速变化对于 质量浓度的影响程度越大;其次是 质量浓度与相对湿度呈现出较明显的正相关关系,即相对湿度越大,呈现出较高的 质量浓度监测值。最后是 质量浓度与温度的无明显相关关系的结论。
四、数据可视化
(一)数据可视化的定义
根据2008年迈克尔?路易斯?弗兰德利在文献中的定义:数据可视化是关于数据之视觉表现形式的研究。其中,这种数据的视觉表现形式被定义为一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。
(二)数据可视化的目的
所有数据的分析、挖掘,其最终目的是将信息呈现给用户。所以数据的可视化,是最终面对用户的,是让用户可以体验到所有的设计,感受数据之美,但背后大量单调的数据,用户看不到。
(三)数据可视化的原则
可视化不是自己通过想象去展现,在互联网上有着各式各样的图形,以最基础的图形要素为主。因为最基础的图形要素表达信息最准确,也最为直观,用户可以很容易理解它要表达的内容。
对图形元素进行组合、展现时,应确保图形的表达准确,分类合理。图形基本元素众多,长短、倾斜度可体现数据变化,图形大小、明暗度、色彩、形状等都可进行可视化展现。通过高矮可以区分数量大小,通过颜色可以区分类别。要想将最重要的信息传递给用户,相应的坐标图、说明文字、分类都是非常重要的。
(四)数据可视化的流程
数据可视化包含许多步骤:数据获取、数据描述、数据的预处理、数据挖掘与分析、数据呈现、数据改善、数据交互。其中,在使用已有软件时无法完成最后的数据交互这一步,若是由编程代码实现的数据可视化则可以完成最后的数据交互。我们是基于已有软件对 质量浓度特征结果的简单数据可视化,没有完成数据交互这一步。
(五)数据呈现
基于本文所做的数据获取、描述、预处理和挖掘分析等操作,运用Arcgis相关软件制作了北京地形信息的三维立体展现和 与风速、温度关系的数据可视化。将北京冬季 质量浓度特征随时间变化结果进行简单的可视化表达,如下:
(六)数据改善决策
经过科学的数据分析与简单的可视化表达,我们可以看到 质量浓度与季节和温度无直接关系,若要降低 质量浓度,不仅要在冬季严防爆竹燃放,也要在夏季严防秸秆燃烧,对于排放烟尘的工厂应严格限定排放量,做到一年四季都从源头控制细颗粒物的排放。
五、本文优点与不足
本文优点首先在于采取了较新的数据,更加准确地反映了近期质量浓度的变化趋势特点。其次本文较为详尽地分析了质量浓度与气象因素的关系,并且引用了5日为一个周期,分析了质量浓度与气象因素相关性的变化特点。得出了质量浓度越大,质量浓度与风速相关性越大的结论。最后运用Arcgis、ENVI相关软件对分析结果进行了可视化表达,使得用户更加方便快捷直观的获取到分析结果的相关信息。
本文的不足之处是对于质量浓度的北京市的各地区没有进行差异性分析。另外对于分析质量浓度与气象因素相关性的变化特点时选用的5日为一个周期或许存在不尽完善之处。还有数据可视化的模型较为简单,直接利用已有软件进行可视化表达,没有完成最后的数据交互这一步骤,如果能够通过编写程序和代码会使该研究内容的的数据可视化更加精确,更加美观,希望在以后的研究中有所改进。
项目资助:大学生创新创业训练计划项目(校级A类:2014AX024)。
参考文献:
[1]戴海夏.大气PM2.5的健康影响. 国外医学(卫生学分册), 2001-09-25
[2]杨复沫.北京大气PM2.5中微量元素的浓度变化特征与来源. 环境科学,2003-11-30
[3]梁明易.广州冬季霾天气大气PM_2_5_污染特征分析.中国环境监测,2007-10-15
[4] 何平. 上海宝山地区大气PM_2_5_污染特征分析. 环境与职业医学,2010-12-25 [5]迈克尔?路易斯?弗兰德利. "Milestones in the history of thematic cartography, statistical graphics, and data visualization",2008
作者简介:
李莎莎(1994.8-),女,籍贯:内蒙古通辽市,中国地质大学(北京)信息工程学院地理信息系统专业2012级本科生。