论文部分内容阅读
摘要:制定污染源编码规则,对污染源进行唯一标识,保证我市的环境统计、普查、排污收费数据的一致性、准确性和有效性。本文主要阐述污染源统一编码规则的现状及存在问题,提出编制污染源编码规则的基本原则,归纳整理出适合我市实际需要的污染源编码规则。
关键词:污染源编码规则
中图分类号:X8 文献标识码:A 文章编号:1672-3791(2012)08(b)-0148-01
1 现状及存在问题
我市污染源家数众多,业务数据数出多门。污染源普查中工业源污染源有2万多家,排污收费污染源有3千多家,环境统计污染源2千多家,监督性监测污染源有3千多家。每年的环境统计、总量减排,每两年的污染源普查,放射源清查都需要在各类业务数据中作污染源数据比对。目前污染源没有统一编码,数据比对仅能依靠污染源名称、法人代码、地址比对,精确比对率在30%一下,模糊比对率也只能在70%以下,有30%是无法比对的。这对于数据共享非常不利。
我国已经意识到污染源统一编码的重要性,并于2010年开展了对污染源统一编码的研究,在2012年发布了《污染源编码规则》(试行),从国家的层面上统一了污染源编码规则。但该编码规则并不能满足我市的实际需要,必须编制符合我市实际需要的污染源编码规则。
2 污染源编码规则的基本原则
2.1 唯一性
确保在适用范围内全部污染源有唯一标识,确保唯一性难度与长度有限性相关,长度越大越容易确保唯一性,反之则确保唯一性的难度加大。
2.2 信息稳定性
提供污染源相对稳定的信息,该性质与信息丰富性相关,缩小了可选信息的范围。例如:污染源化学需氧量含量是很丰富的信息,但鉴于化学需氧量是不稳定,不能选作编码使用信息。
根据我市实际情况,污染源重要信息的稳定级别见表1,由此可见组织机构代码、行政区域、污染源产生时间是适用于作为编码的。
2.3 信息丰富性
提供更丰富的信息,该性质与长度有限性相关,长度越大提供的信息也就越丰富,反之则提供的信息也就越少。例如:身份证编码,18位提供了地址、出生日期、性别等。根据我市实际需求,污染源来说最重要的信息见表1,由此可见污染源行政区划、组织机构代码等是适合作为编码要求
2.4 长度有限性
污染源编码的设计目的决定了污染源编码长度是有限的,长度的决定因素如下:环保信息交换共享和信息稳定性决定了长度的不宜过长;唯一性和信息丰富性决定了长度越长越合适。
我们需要在当中找到两者的平衡点,即满足环保信息交换共享的目的又保持了信息稳定性的最长标识,也可以说满足了唯一性和信息丰富性的最短标识。纸张显示污染源编码的合适长度最好不大于25(大约A4纸张一行方框的数量)。
2.5 正确性
确定某一编码是否是完整、正确的污染源编码,通过校验码来实现该性质。
3 依据上文的5大原则,下面对目前的几种编码方案进行比较
(1)由环保部委托西安长天和北京长能研发的污染源监控基础数据库系统和污染源自动监控系统中使用的污染源编码方案如下。
由12位码进行标识,结构为:9位数字地址码+3位数字顺序码。
该编码方式有如下不足:信息丰富性不够,仅能知道地址;重码率较高,地址相同;不具备自我校验功能。
(2)国家污染源普查污染源编码方案如下。
由25位码进行标识,结构为:12位数字地址码+2位分类码+9位组织机构代码+2位顺序码。
该编码方式有如下不足:地址码引用过长;不具备普遍性,2位分类码仅在普查中起作用,难以推广;不具备自我校验功能。
(3)由环境保护部信息中心和安徽省环境信息中心编制,并于与2011年3月7日发布的污染源编码(试行)方案如下。
A类码:对于具有独立法人资格的法人单位及二级单位,由12位码进行标识,结构为:9位组织机构代码+3位数字顺序码。见
B类码:对于尚未领取组织机构代码或不属于法定赋码范围的单位,由12位码进行标识,结构为:6位数字地址码+5位数字顺序码+1位英文字母顺序码。
B类编码范围的污染源具备A类编码条件后,应按照A类编码原则重新赋码
该编码方式有如下不足:没有明确适用时间范围;信息丰富性不够;不具备自我校验。
(4)推荐的编码方案。
由18位码进行标识,结构为:4位行业分类码+6位数字地址码+6位数字日期码+1位数字顺序码+1位校验码。(如图1)
示例:广州市粤华发电有限公司(4411 440112 197807 1 3)
该编码的优点:突出该污染源行业分类;突出该污染源的地理位置;日期码对于历史数据的标识较清晰,有利于长期使用;具备自我校验功能。
4 结语
污染源编码规则属于广州市环境信息资源共建共享建设七步走的第二步“建立技术规范,为共建共享实施过程提供技术指导”里面的内容。目前已经完成了对我市污染源编码规则的研究,正准备向广州市质监局申请地方行业标准,待发布后我市污染源将严格按照此规则进行编码,解决目前遇到编码不统一所遇到的困难。
参考文献
[1] 环境保护部.污染源编码规则(试行)[S].环境保护部,2011:4.
[2] 高峻峰,等.环境信息资源共享发布技术规范制定[J].广州市环境科学,2010(1):44-48.
[3] 污染源编码-污染源代码编制说明[S].编码组,2010:5.
[4] 第一次全国污染源普查技术规定[S].国家普查办,2007:52.
关键词:污染源编码规则
中图分类号:X8 文献标识码:A 文章编号:1672-3791(2012)08(b)-0148-01
1 现状及存在问题
我市污染源家数众多,业务数据数出多门。污染源普查中工业源污染源有2万多家,排污收费污染源有3千多家,环境统计污染源2千多家,监督性监测污染源有3千多家。每年的环境统计、总量减排,每两年的污染源普查,放射源清查都需要在各类业务数据中作污染源数据比对。目前污染源没有统一编码,数据比对仅能依靠污染源名称、法人代码、地址比对,精确比对率在30%一下,模糊比对率也只能在70%以下,有30%是无法比对的。这对于数据共享非常不利。
我国已经意识到污染源统一编码的重要性,并于2010年开展了对污染源统一编码的研究,在2012年发布了《污染源编码规则》(试行),从国家的层面上统一了污染源编码规则。但该编码规则并不能满足我市的实际需要,必须编制符合我市实际需要的污染源编码规则。
2 污染源编码规则的基本原则
2.1 唯一性
确保在适用范围内全部污染源有唯一标识,确保唯一性难度与长度有限性相关,长度越大越容易确保唯一性,反之则确保唯一性的难度加大。
2.2 信息稳定性
提供污染源相对稳定的信息,该性质与信息丰富性相关,缩小了可选信息的范围。例如:污染源化学需氧量含量是很丰富的信息,但鉴于化学需氧量是不稳定,不能选作编码使用信息。
根据我市实际情况,污染源重要信息的稳定级别见表1,由此可见组织机构代码、行政区域、污染源产生时间是适用于作为编码的。
2.3 信息丰富性
提供更丰富的信息,该性质与长度有限性相关,长度越大提供的信息也就越丰富,反之则提供的信息也就越少。例如:身份证编码,18位提供了地址、出生日期、性别等。根据我市实际需求,污染源来说最重要的信息见表1,由此可见污染源行政区划、组织机构代码等是适合作为编码要求
2.4 长度有限性
污染源编码的设计目的决定了污染源编码长度是有限的,长度的决定因素如下:环保信息交换共享和信息稳定性决定了长度的不宜过长;唯一性和信息丰富性决定了长度越长越合适。
我们需要在当中找到两者的平衡点,即满足环保信息交换共享的目的又保持了信息稳定性的最长标识,也可以说满足了唯一性和信息丰富性的最短标识。纸张显示污染源编码的合适长度最好不大于25(大约A4纸张一行方框的数量)。
2.5 正确性
确定某一编码是否是完整、正确的污染源编码,通过校验码来实现该性质。
3 依据上文的5大原则,下面对目前的几种编码方案进行比较
(1)由环保部委托西安长天和北京长能研发的污染源监控基础数据库系统和污染源自动监控系统中使用的污染源编码方案如下。
由12位码进行标识,结构为:9位数字地址码+3位数字顺序码。
该编码方式有如下不足:信息丰富性不够,仅能知道地址;重码率较高,地址相同;不具备自我校验功能。
(2)国家污染源普查污染源编码方案如下。
由25位码进行标识,结构为:12位数字地址码+2位分类码+9位组织机构代码+2位顺序码。
该编码方式有如下不足:地址码引用过长;不具备普遍性,2位分类码仅在普查中起作用,难以推广;不具备自我校验功能。
(3)由环境保护部信息中心和安徽省环境信息中心编制,并于与2011年3月7日发布的污染源编码(试行)方案如下。
A类码:对于具有独立法人资格的法人单位及二级单位,由12位码进行标识,结构为:9位组织机构代码+3位数字顺序码。见
B类码:对于尚未领取组织机构代码或不属于法定赋码范围的单位,由12位码进行标识,结构为:6位数字地址码+5位数字顺序码+1位英文字母顺序码。
B类编码范围的污染源具备A类编码条件后,应按照A类编码原则重新赋码
该编码方式有如下不足:没有明确适用时间范围;信息丰富性不够;不具备自我校验。
(4)推荐的编码方案。
由18位码进行标识,结构为:4位行业分类码+6位数字地址码+6位数字日期码+1位数字顺序码+1位校验码。(如图1)
示例:广州市粤华发电有限公司(4411 440112 197807 1 3)
该编码的优点:突出该污染源行业分类;突出该污染源的地理位置;日期码对于历史数据的标识较清晰,有利于长期使用;具备自我校验功能。
4 结语
污染源编码规则属于广州市环境信息资源共建共享建设七步走的第二步“建立技术规范,为共建共享实施过程提供技术指导”里面的内容。目前已经完成了对我市污染源编码规则的研究,正准备向广州市质监局申请地方行业标准,待发布后我市污染源将严格按照此规则进行编码,解决目前遇到编码不统一所遇到的困难。
参考文献
[1] 环境保护部.污染源编码规则(试行)[S].环境保护部,2011:4.
[2] 高峻峰,等.环境信息资源共享发布技术规范制定[J].广州市环境科学,2010(1):44-48.
[3] 污染源编码-污染源代码编制说明[S].编码组,2010:5.
[4] 第一次全国污染源普查技术规定[S].国家普查办,2007:52.