基于数据挖掘的环境监测数据监管应用研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:LINGER123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术在当前得到了广泛的应用,目前主要应用于金融、生物制药、银行信贷等领域,然而对环境监测数据在环境监管领域的应用研究还较少。在总量减排的要求之下,环境监测系统在国内不断普及,随之产生了大量的环境监测数据,而且随着政府数据公开工作的推进,环境监测数据的获取途径也在不断增加。因此,探索适用于当前环境监测数据特点的数据挖掘技术,为环境监测数据监管工作提供新的思路就显得尤为重要。鉴于上述问题,本文通过文献调研对当前数据挖掘工具进行分析与对比,筛选出适合当前环境监测数据特点的挖掘工具,确立了以Python作为主要开发语言,以其Scrapy数据采集框架作为主要工具应用于数据挖掘准备阶段,以其pandas,numpy模块作为主要工具应用于数据分析阶段,以其Matplotlib模块作为主要工具应用于绘图阶段的数据挖掘流程。在确立了从数据准备、数据分析、结果展示的环境监测数据流程的基础上,对河南、湖南、四川、浙江、新疆、内蒙古等省和自治区的环境监测数据中的企业排污数据进行了数据采集,搭建了关系型数据库(MySQL)和分布式数据库(Cassandra),分别用于存储企业排污监测数据的元数据和具体监测数据。并以火电企业为例对其机组排放数据近三个月的数据进行数据分析,通过数据挖掘可以较为容易的发现排放规律和异常情况,使得环境监管的工作得以简化。并验证了上述数据挖掘工具的选用以及分析流程适用于当前环境监测数据的挖掘,为环境监测数据监管工作提供新的思路。
其他文献
目的观察黄芪注射液治疗肺原性心脏病心力衰竭的临床疗效.方法对照组45例应用西医常规治疗;治疗组50例在西医常规治疗基础上加用黄芪注射液20ml于5%葡萄糖注射液250 ml中静脉
当今世界的水体环境中,重金属离子污染日益严重,威胁着人类的健康,特别是铅、铬等重金属离子,对人类身心健康造成严重危害。粘土矿物是地球表面的重要组成,其粒度细、表面积
岩土工程勘察是工程建设的基础,勘察的质量会直接关系到后续建筑施工的整体质量和施工安全.因此,对工程建设地点的地质条件、水文条件等进行勘察,有着十分重要的意义.基于此,
慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)和肺癌这两种肺部常见疾病的发病率及病死率呈逐年上升,造成了巨大的社会及家庭负担。研究发现COPD患者肺癌发病
本文通过简要评述Poehner的著作《动态评估:从维果斯基理论角度理解和促进二语发展》,向读者介绍了一个基于Vygotsky社会文化理论和最近发展区的重要理论——动态评估理论。
海原—六盘山构造带是青藏高原东北缘地区的一条重要边界,在海原断裂带和六盘山断裂带接触区形成了特殊的马东山挤压阶区,本文对跨过该挤压阶区一条密集测点大地电磁剖面数据进
近年来,随着城市化脚步加快,我国城市化水平不断提高,而一味追求经济增长的过程中忽略的环境保护,引发了一系列生态环境破坏与污染问题。笔者结合所学知识,从生态环境中的热