论文部分内容阅读
随着“互联网 ”、“大数据”产业的兴起,越来越多的地方政府已经意识到数据的重要性,“掌握大数据,意味着掌控未来”。然而,由于政府部门数据信息存在严重的割裂和壁垒,大数据开发面临无源之水的困境。
2014年6月,佛山市南海区率先成立全国首个县区一级数据统筹机构,为全国政府数据治理探路。两年来,南海区打破部门数据“孤岛”,对大数据开发与应用进行了有效的探索。
高规格政府机构的诞生
过去,政府部门一直是一个地区数据采集、归总、运用、传播的主导者。但各部门数据呈分割状态,缺乏有效分析、整合,政府数据信息对外开放程度也极为有限,极大地制约了大数据的共享与利用。
南海早在1996年就制定了信息化战略,经过十几年的运行累积了海量的数据。据统计,2014年,全区各部门的信息化业务系统达到157个,不含视频、图片在内的文字政务信息总存储量已超过100TB。
虽然90%以上的信息系统及数据库都已部署到区政务机房,但是由于信息系统之间存在较多机制的壁垒,信息数据呈现出分散、无序的孤岛现状,信息数据的实际利用率非常低。
比如,交警部门掌握了全年交通事故全市的数据,死伤数量、事故原因、事发地段甚至肇事车辆类型等,这些数据如果能结合天气、路况、汽车保险等相关数据来分析,可能会得出新的结论,对于防止交通事故有重要价值。但这些原本可以挖掘的数据被割裂在一个个部门,没有与关联数据进行整合,因此难以产生决策的价值。
各部门内部数据的割裂有时甚至是有意为之。比如,某部门扶持中小企业的资金,网上也公布了名单,但如果对5年以来的名单进行统计,可能会发现这些资金长期投放的是固定的几家企业,怕引起公众质疑而将其它4年的隐去了。而水务部门知道一场大雨后城市有多少水浸街的黑点,但为了避免舆论压力,至少不会主动公布这些黑点以及针对性的整治情况。
反过来,如果一个城市规划能汇总负责煤气管道、电缆、道路施工、交通等各个部门的大数据,在规划之初就进行大数据的整合、分析,就不用今天挖明天推后天再挖路了。
在数据开放上,一些部门也是出于自身利益的考量,不能主动、积极地公布一些公众急需的信息。对于市民关心的环保、医疗、教育等数据信息,政府部门总是希望以信息不对称的方式躲避舆论监督,隐藏非国家机密的数据,这是很多部门的惯常心态。
政府部门内部大数据的整合和开放是关键。随着时间的推移,各个部门所掌握的政务信息量只会越来越大,往后的整合成本也会越来越大。
2014年,南海区专门成立高规格的网络安全和信息化领导小组,由区委书记亲自出任网信领导小组组长,下设“一办一局两中心”,“一局”即为数据统筹局。数据统筹局也是高规格,直属于区委区政府办公室。南海数据统筹局是全国首个县区级层面设立以“数据统筹”为重心的部门,标志着信息化改革进入深水区,由此拉开了南海“第二次信息革命”的序幕。
连通“信息孤岛”
为了打破各自为政的数据权力格局,实现全区政府部门数据共享,南海数据统筹局首先开展“清家底”。部门数据总量有多大,类别有多少,如果摸不清家底,大数据的蓝图无从谈起。
南海数据统筹局要求各部门把各自的数据按照统一标准,录入到大数据库里,通过“前置机信息管理系统”,系统可以自动抓取,而一些信息化程度较落后的部门就要靠数据专员手动提交。这些第一手数据大多有问题,需要梳理、检查错误,甚至要反馈回部门要求修改。经过处理后,系统会按照主题、机构自动生成资源目录平台。由于不同部门、不同系统的数据标准相差很大,因此需要一个个梳理。
南海数据统筹局收集了来自全区90个数源单位的数据,初步梳理72个单位共1815个数据表,识别、整理出1083个数据表,从而建设了覆盖全区的地图库、人口库、企业库、城市环境库、政务库、产业经济库、决策分析库七大数据库。数据统筹局还在各个单位设立首席数据官,由单位负责人担任。用专人专员的办法,建立起数据源和数据库之间的畅通渠道。
为了解决信息安全的问题,南海区数据统筹局设计了数据分级管理体系,所有数据分A、B、C、D4个等级,D级为完全公开,可供全社会自由浏览、下载;C级为依申请公开,如个人社保信息等;B级为行政部门或广义政府部门局部或完全共享;A级保密程度最高,仅供政府统计分析,占总量的5%左右。定级要有相关文件作为依据,文件要求公开的或不公开的,要一一标识出来。
一些条线部门上级对数据共享没有做出明确、详细的规定,基层部门就会有很多顾虑,怕承担责任。南海区数据统筹局试图通过“利益诱导”,而非单纯的行政命令去推进数据统筹,让各部门切实尝到数据统筹的好处。
例如,检察院要查清一些官员的资产情况、出入境情况等等,查起来非常麻烦,而数据统筹以后就方便了很多,可以方便地发现哪位官员一年出国多少次,然后再进一步筛查到底是干什么,腐败预防机制随之完善,也提高了检察院的工作效率。
数据公开前需要进行清洗比对,不同部门对同一个数据的测量结果不一样,碰到这样的数据打架怎么办?这就倒逼采集数据部门需要相应地修改原来的流程、采集方式、人力配置等等,以适应新标准的要求。
呼唤顶层设计
从全国来看,做政务大数据南海并不是第一个,北京、上海早已开始了相关的应用。但南海选择以数据开放作为突破口来推动数据统筹。
与北京上海相比,南海的开放数据集是最多的。北京傾向于民生类数据的开放,上海则倾向于经济类数据的开放,南海涵盖了两种,无论是量还是范围都比较大。更关键的是,北京和上海聚焦的是静态数据,比如人口数量等;南海则更关注动态数据,比如,更加关注人背后的计生情况、健康情况、社保情况等。根据这些数据可以进行更多分析,促使政府从静态化治理走向动态化治理,更为科学地作出研判和决策。
在关注政府内部管理需求的同时,南海也更加关注各种对信息服务的需求。不仅要以数据便民,方便企业市民办事,还要让公众充分参与到政府决策中去,用数据统筹搭建沟通桥梁。政府先做好统筹工作,把底层数据库做起来。企业只要有需求,想到什么应用都可以做。通过企业的参与建设,促进数据的二次三次开发运用。
从南海的实践来看,大数据建设是一个系统性改革,国家和省级层面需要加快相关顶层设计,“南海可以单兵突进,但也需要协同发展”。
有关方面应及时出台政策,对大数据的建设做中长期的规划,要明确各级政府的角色定位。比如国家做好顶层设计,省级政府着重于制定大数据产业发展规划和政府数据应用指导意见,市级政府加强对区、县的监管协调和相关标准规范的制定,区级政府则因地制宜地推动大数据技术在政府、企业中的应用,带动大数据相关产业的发展。
要充分调动地方在数据采集、管理、应用和开放等方面的积极性和创造性。各级政府部门间应着眼于数据的共享,而非应用系统的统一建设。数据要统筹协调、标准规范,应用系统可以各显其能、各具特色,以数据为纽带,通过数据共享打通部门应用壁垒,实现信息互联和数据分析挖掘。
另外,还要避免盲目投资、重复建设和恶性竞争。有些地方花了巨额资金搞硬件网络平台,但在软件应用方面却严重滞后。大数据时代,必须吸取以往的教训。此外,数据公开所带来的公民隐私、信息安全等一系列法律问题,以及政府部门的办事规矩,也需要更高层面上的统筹和协调。
2014年6月,佛山市南海区率先成立全国首个县区一级数据统筹机构,为全国政府数据治理探路。两年来,南海区打破部门数据“孤岛”,对大数据开发与应用进行了有效的探索。
高规格政府机构的诞生
过去,政府部门一直是一个地区数据采集、归总、运用、传播的主导者。但各部门数据呈分割状态,缺乏有效分析、整合,政府数据信息对外开放程度也极为有限,极大地制约了大数据的共享与利用。
南海早在1996年就制定了信息化战略,经过十几年的运行累积了海量的数据。据统计,2014年,全区各部门的信息化业务系统达到157个,不含视频、图片在内的文字政务信息总存储量已超过100TB。
虽然90%以上的信息系统及数据库都已部署到区政务机房,但是由于信息系统之间存在较多机制的壁垒,信息数据呈现出分散、无序的孤岛现状,信息数据的实际利用率非常低。
比如,交警部门掌握了全年交通事故全市的数据,死伤数量、事故原因、事发地段甚至肇事车辆类型等,这些数据如果能结合天气、路况、汽车保险等相关数据来分析,可能会得出新的结论,对于防止交通事故有重要价值。但这些原本可以挖掘的数据被割裂在一个个部门,没有与关联数据进行整合,因此难以产生决策的价值。
各部门内部数据的割裂有时甚至是有意为之。比如,某部门扶持中小企业的资金,网上也公布了名单,但如果对5年以来的名单进行统计,可能会发现这些资金长期投放的是固定的几家企业,怕引起公众质疑而将其它4年的隐去了。而水务部门知道一场大雨后城市有多少水浸街的黑点,但为了避免舆论压力,至少不会主动公布这些黑点以及针对性的整治情况。
反过来,如果一个城市规划能汇总负责煤气管道、电缆、道路施工、交通等各个部门的大数据,在规划之初就进行大数据的整合、分析,就不用今天挖明天推后天再挖路了。
在数据开放上,一些部门也是出于自身利益的考量,不能主动、积极地公布一些公众急需的信息。对于市民关心的环保、医疗、教育等数据信息,政府部门总是希望以信息不对称的方式躲避舆论监督,隐藏非国家机密的数据,这是很多部门的惯常心态。
政府部门内部大数据的整合和开放是关键。随着时间的推移,各个部门所掌握的政务信息量只会越来越大,往后的整合成本也会越来越大。
2014年,南海区专门成立高规格的网络安全和信息化领导小组,由区委书记亲自出任网信领导小组组长,下设“一办一局两中心”,“一局”即为数据统筹局。数据统筹局也是高规格,直属于区委区政府办公室。南海数据统筹局是全国首个县区级层面设立以“数据统筹”为重心的部门,标志着信息化改革进入深水区,由此拉开了南海“第二次信息革命”的序幕。
连通“信息孤岛”
为了打破各自为政的数据权力格局,实现全区政府部门数据共享,南海数据统筹局首先开展“清家底”。部门数据总量有多大,类别有多少,如果摸不清家底,大数据的蓝图无从谈起。
南海数据统筹局要求各部门把各自的数据按照统一标准,录入到大数据库里,通过“前置机信息管理系统”,系统可以自动抓取,而一些信息化程度较落后的部门就要靠数据专员手动提交。这些第一手数据大多有问题,需要梳理、检查错误,甚至要反馈回部门要求修改。经过处理后,系统会按照主题、机构自动生成资源目录平台。由于不同部门、不同系统的数据标准相差很大,因此需要一个个梳理。
南海数据统筹局收集了来自全区90个数源单位的数据,初步梳理72个单位共1815个数据表,识别、整理出1083个数据表,从而建设了覆盖全区的地图库、人口库、企业库、城市环境库、政务库、产业经济库、决策分析库七大数据库。数据统筹局还在各个单位设立首席数据官,由单位负责人担任。用专人专员的办法,建立起数据源和数据库之间的畅通渠道。
为了解决信息安全的问题,南海区数据统筹局设计了数据分级管理体系,所有数据分A、B、C、D4个等级,D级为完全公开,可供全社会自由浏览、下载;C级为依申请公开,如个人社保信息等;B级为行政部门或广义政府部门局部或完全共享;A级保密程度最高,仅供政府统计分析,占总量的5%左右。定级要有相关文件作为依据,文件要求公开的或不公开的,要一一标识出来。
一些条线部门上级对数据共享没有做出明确、详细的规定,基层部门就会有很多顾虑,怕承担责任。南海区数据统筹局试图通过“利益诱导”,而非单纯的行政命令去推进数据统筹,让各部门切实尝到数据统筹的好处。
例如,检察院要查清一些官员的资产情况、出入境情况等等,查起来非常麻烦,而数据统筹以后就方便了很多,可以方便地发现哪位官员一年出国多少次,然后再进一步筛查到底是干什么,腐败预防机制随之完善,也提高了检察院的工作效率。
数据公开前需要进行清洗比对,不同部门对同一个数据的测量结果不一样,碰到这样的数据打架怎么办?这就倒逼采集数据部门需要相应地修改原来的流程、采集方式、人力配置等等,以适应新标准的要求。
呼唤顶层设计
从全国来看,做政务大数据南海并不是第一个,北京、上海早已开始了相关的应用。但南海选择以数据开放作为突破口来推动数据统筹。
与北京上海相比,南海的开放数据集是最多的。北京傾向于民生类数据的开放,上海则倾向于经济类数据的开放,南海涵盖了两种,无论是量还是范围都比较大。更关键的是,北京和上海聚焦的是静态数据,比如人口数量等;南海则更关注动态数据,比如,更加关注人背后的计生情况、健康情况、社保情况等。根据这些数据可以进行更多分析,促使政府从静态化治理走向动态化治理,更为科学地作出研判和决策。
在关注政府内部管理需求的同时,南海也更加关注各种对信息服务的需求。不仅要以数据便民,方便企业市民办事,还要让公众充分参与到政府决策中去,用数据统筹搭建沟通桥梁。政府先做好统筹工作,把底层数据库做起来。企业只要有需求,想到什么应用都可以做。通过企业的参与建设,促进数据的二次三次开发运用。
从南海的实践来看,大数据建设是一个系统性改革,国家和省级层面需要加快相关顶层设计,“南海可以单兵突进,但也需要协同发展”。
有关方面应及时出台政策,对大数据的建设做中长期的规划,要明确各级政府的角色定位。比如国家做好顶层设计,省级政府着重于制定大数据产业发展规划和政府数据应用指导意见,市级政府加强对区、县的监管协调和相关标准规范的制定,区级政府则因地制宜地推动大数据技术在政府、企业中的应用,带动大数据相关产业的发展。
要充分调动地方在数据采集、管理、应用和开放等方面的积极性和创造性。各级政府部门间应着眼于数据的共享,而非应用系统的统一建设。数据要统筹协调、标准规范,应用系统可以各显其能、各具特色,以数据为纽带,通过数据共享打通部门应用壁垒,实现信息互联和数据分析挖掘。
另外,还要避免盲目投资、重复建设和恶性竞争。有些地方花了巨额资金搞硬件网络平台,但在软件应用方面却严重滞后。大数据时代,必须吸取以往的教训。此外,数据公开所带来的公民隐私、信息安全等一系列法律问题,以及政府部门的办事规矩,也需要更高层面上的统筹和协调。