论文部分内容阅读
摘要:根据固定污染源数量大而复杂,数据权威性不够等现状,通过机器学习向量空间模型算法对固定污染源数据进行挖掘和梳理,制定污染源数据管理规范完善数据动态共享机制,以此摸清底数,说清源头,建立具有权威性的固定污染源统一标准数据库。
关键词:污染源梳理;机器学习;向量空间模型算法;管理规范;污染源统一标准数据库
1 固定污染源管理现状
近年来,随着环境信息化建设的不断推进,集成了大量环境管理数据,实现了基于大量环境管理数据的分析展示和多场景应用,但由于污染源数据庞大及缺乏相应的固定污染源数据管理制度,导致“一数多源问题”、固定污染源底数不清、数据权威性问题。
2 固定污染源数据梳理目标
本研究为准确的说清固定污染源底数,形成固定污染源信息动态更新的机制,尽快从根本上解决固定污染源“一数多源”、底数不清、数据权威性问题,改善生态环境质量,保护区域生态安全,提高环境监管能力,开展以下建设工作:
2.1 建立固定污染源身份信息管理
制定固定污染源信息管理技术规范,建立、运行和维护全省固定污染源全生命周期信息管理系统,固定污染源信息管理应当遵循全省统一编码、统一规则、统一系统、统一使用的基本原则,集中管理已有固定污染源身份信息、环境属性、管理属性等数据。
2.2 建立固定污染源身份信息动态更新机制
按照固定污染源信息动态管理技术规范要求,确保新增污染源身份唯一、信息权威,实现新增合法污染源信息在固定污染源管理系统中的录入,实现当污染源环境监管信息变更后对固定污染源信息管理系统内容进行更新;实现在线监测信息、视频监控信息应与固定污染源信息管理系统保持实时动态更新;实现现有污染源因停产、关闭、搬迁、转型、淘汰等原因停止排放污染物的,通过固定污染源管理系统对污染源信息进行注销记录。
2.3 建立固定污染源数据管理考核制度
通过建立固定污染源数据管理考核制度,实现对固定源身份信息共享使用情况的统计考核管理。
建立数据治理、主动校验、数据标准管理体系,实现对固定源身份信息项管理、数据标准结构获取以及标准项主动校核,主动发现业务系统使用固定污染源身份信息情况。
2.4 建立固定污染源身份信息数据访问服务
固定污染源管理信息系統综合集成固定污染源基本信息、基础信息、环境属性信息以及监管信息等内容。各业务有关的管理系统应在固定污染源管理信息系统上使用,并基于唯一身份信息进行运营维护,确保污染源信息完整统一、及时更新、准确可靠,因此通过建设固定污染源身份信息数据访问服务,供各业务系统调用,实现所有业务系统基于固定污染源编码运营维护各业务系统,各业务系统按照污染源身份信息进行更新,实现对污染源的统一、动态、协同管理。
通过固定污染源身份信息数据新增服务,业务系统可利用该接口进行新增固定污染源身份信息操作,生成标准的固定污染源编码。
通过固定污染源身份信息数据修改服务,业务系统可利用该接口进行固定污染源身份信息修改操作。
2.5 建立固定污染源历史数据整合清洗服务
对现有业务系统的固定污染源信息进行清洗、匹配以及补充采集等操作,以排污许可证数据为标准,整合污染源数据分析科研课题成果、环境影响评价、在线监控、监察执法、信访投诉、行政处罚等数据,实现数据的初始化工作。
2.6 建立固定污染源档案管理
围绕排污许可证制度对行业固定汚染源、生产设施、治理设施、排放口进行统一编码、归档污染源从审批起的所有资料,形成的“一企一档、一企多源”管理模式,实现对固定污染源全生命周期管理。
2.7 人工智能数据分析
本次研究对机器学习NLP模型进行深入实验,其强大的分词能力和近似内容匹配能力可提高污染源身份数据50%~70%的匹配率。同时,实验表明机器学习对于错别字的辨别能力也非常出色,有效识别“某某省砂石厂”和“某某省沙石厂”的相似性,以此辅助污染源身份数据梳理是非常重要的技术手段。
3 固定污染源数据梳理总结
简而言之,固定污染源梳理是一项手段但绝不是结果,要打赢污染源摸底持久战我们还有很长的路要走,在本次科研成果的指导下,需要不断提高行政治理能力、加强执法力度、完善管理制度,借助大数据和人工智能挖掘技术不断提高数据的完整性和准确性。
参考文献:
[1] 宋婷.环境空气和固定污染源中挥发性有机物监测方法探讨[J].环境与发展,2018(10).
[2] 王焕松,柴西龙,姚懿函.排污许可制度基层实践与顶层设计优化探索[J].环境保护,2018(08).
[3] 张树岳.固定污染源在线监测比对现状及存在的问题[J].环境与发展,2014(04).
作者简介:孙炼(1987—),女,四川成都人,工程师,本科,研究方向:环境工程。
(作者单位:四川省环境信息中心)
关键词:污染源梳理;机器学习;向量空间模型算法;管理规范;污染源统一标准数据库
1 固定污染源管理现状
近年来,随着环境信息化建设的不断推进,集成了大量环境管理数据,实现了基于大量环境管理数据的分析展示和多场景应用,但由于污染源数据庞大及缺乏相应的固定污染源数据管理制度,导致“一数多源问题”、固定污染源底数不清、数据权威性问题。
2 固定污染源数据梳理目标
本研究为准确的说清固定污染源底数,形成固定污染源信息动态更新的机制,尽快从根本上解决固定污染源“一数多源”、底数不清、数据权威性问题,改善生态环境质量,保护区域生态安全,提高环境监管能力,开展以下建设工作:
2.1 建立固定污染源身份信息管理
制定固定污染源信息管理技术规范,建立、运行和维护全省固定污染源全生命周期信息管理系统,固定污染源信息管理应当遵循全省统一编码、统一规则、统一系统、统一使用的基本原则,集中管理已有固定污染源身份信息、环境属性、管理属性等数据。
2.2 建立固定污染源身份信息动态更新机制
按照固定污染源信息动态管理技术规范要求,确保新增污染源身份唯一、信息权威,实现新增合法污染源信息在固定污染源管理系统中的录入,实现当污染源环境监管信息变更后对固定污染源信息管理系统内容进行更新;实现在线监测信息、视频监控信息应与固定污染源信息管理系统保持实时动态更新;实现现有污染源因停产、关闭、搬迁、转型、淘汰等原因停止排放污染物的,通过固定污染源管理系统对污染源信息进行注销记录。
2.3 建立固定污染源数据管理考核制度
通过建立固定污染源数据管理考核制度,实现对固定源身份信息共享使用情况的统计考核管理。
建立数据治理、主动校验、数据标准管理体系,实现对固定源身份信息项管理、数据标准结构获取以及标准项主动校核,主动发现业务系统使用固定污染源身份信息情况。
2.4 建立固定污染源身份信息数据访问服务
固定污染源管理信息系統综合集成固定污染源基本信息、基础信息、环境属性信息以及监管信息等内容。各业务有关的管理系统应在固定污染源管理信息系统上使用,并基于唯一身份信息进行运营维护,确保污染源信息完整统一、及时更新、准确可靠,因此通过建设固定污染源身份信息数据访问服务,供各业务系统调用,实现所有业务系统基于固定污染源编码运营维护各业务系统,各业务系统按照污染源身份信息进行更新,实现对污染源的统一、动态、协同管理。
通过固定污染源身份信息数据新增服务,业务系统可利用该接口进行新增固定污染源身份信息操作,生成标准的固定污染源编码。
通过固定污染源身份信息数据修改服务,业务系统可利用该接口进行固定污染源身份信息修改操作。
2.5 建立固定污染源历史数据整合清洗服务
对现有业务系统的固定污染源信息进行清洗、匹配以及补充采集等操作,以排污许可证数据为标准,整合污染源数据分析科研课题成果、环境影响评价、在线监控、监察执法、信访投诉、行政处罚等数据,实现数据的初始化工作。
2.6 建立固定污染源档案管理
围绕排污许可证制度对行业固定汚染源、生产设施、治理设施、排放口进行统一编码、归档污染源从审批起的所有资料,形成的“一企一档、一企多源”管理模式,实现对固定污染源全生命周期管理。
2.7 人工智能数据分析
本次研究对机器学习NLP模型进行深入实验,其强大的分词能力和近似内容匹配能力可提高污染源身份数据50%~70%的匹配率。同时,实验表明机器学习对于错别字的辨别能力也非常出色,有效识别“某某省砂石厂”和“某某省沙石厂”的相似性,以此辅助污染源身份数据梳理是非常重要的技术手段。
3 固定污染源数据梳理总结
简而言之,固定污染源梳理是一项手段但绝不是结果,要打赢污染源摸底持久战我们还有很长的路要走,在本次科研成果的指导下,需要不断提高行政治理能力、加强执法力度、完善管理制度,借助大数据和人工智能挖掘技术不断提高数据的完整性和准确性。
参考文献:
[1] 宋婷.环境空气和固定污染源中挥发性有机物监测方法探讨[J].环境与发展,2018(10).
[2] 王焕松,柴西龙,姚懿函.排污许可制度基层实践与顶层设计优化探索[J].环境保护,2018(08).
[3] 张树岳.固定污染源在线监测比对现状及存在的问题[J].环境与发展,2014(04).
作者简介:孙炼(1987—),女,四川成都人,工程师,本科,研究方向:环境工程。
(作者单位:四川省环境信息中心)