论文部分内容阅读
收稿日期:2020-09-23
基金项目:国家社会科学基金项目“开放政府数据的风险识别、评估及防控体系研究”(项目编号:18XTQ010);甘肃省社会科学规划一般项目“开放政府数据背景下甘肃开放政府数据发展策略研究”(项目编号:YB057);甘肃省“十三五”教育科学规划重点课题“甘肃省教育数据开放研究”(项目编号:GS[2017]GHBZ038)。
作者簡介:赵润娣(1975-),女,副教授,博士,硕士生导师,研究方向:数字政府治理、公共危机信息管理。
摘要:[目的/意义]近年来在全球开放政府数据浪潮中,中国政府持续推进政府数据开放与利用。开放政府数据过程中政府数据开放分类分级,对保障政府数据安全、促进政府数据充分流动、发挥政府数据潜能具有重要意义。[方法/过程]本文聚焦于中国开放政府数据过程中政府数据资源分类分级问题,在2018年和2020年,对我国8个开放政府数据平台教育主题数据资源分类分级状况进行了两次调查。[结果/结论]通过分析我国开放政府数据平台数据资源分类分级实践表现,探究我国政府数据开放分类分级存在的问题,进而提出我国开放政府数据过程中政府数据资源分类分级发展策略。
关键词:开放政府数据;数据资源;分类分级;开放政府数据平台;教育数据
DOI:10.3969/j.issn.1008-0821.2021.04.010
〔中图分类号〕D035-39〔文献标识码〕A〔文章编号〕1008-0821(2021)04-0090-11
Research on the Classification and Hierarchization of
Open Government Data Resources in China
——Based on Surveys of Educational Data of Open Government Data Portals
Zhao Rundi
(College of Social Development and Public Administration,Northwest Normal University,
Lanzhou 730070,China)
Abstract:[Purpose/Significance]In recent years,With the global wave of open government data,China has continued to promote the openness and utilization of government data.It is important to ensure government data security and promote government data flow fully through classification and hierarchization of government data.[Method/Process]This paper focused on classification and hierarchization of government data resources during China open government data process.In 2018 and 2020,two surveys were conducted on the classification and hierarchization of educational subject data resources on eight open government data portals.[Result/Conclusion]Through analyzing the classification and hierarchization practice,this paper explored problems existing in the classification and hierarchization of data resources of open government data,and then put forward the development strategy of classification and hierarchization of government data resources during China open government data process.
Key words:open government data;data resources;classification and hierarchization;open government data portal;education data
近年来,我国从中央政府到地方政府都在积极推进开放政府数据资源建设。开放政府数据过程中政府数据资源分类分级引起了政策层面一定的关注。2017年国务院办公厅发布《国务院办公厅关于印发政务信息系统整合共享实施方案的通知》。2018年国家发展改革委、中央网信办印发《政务信息资源目录编制指南(试行)》。2020年中共中央、国务院印发《关于构建更加完善的要素市场化配置体制机制的意见》,其中指出“要推动完善适用于大数据环境下的数据分类分级安全保护制度”[1]。2016年贵州省出台《政府数据分类分级指南》。2019年上海市试行《上海市公共数据开放分级分类指南(试行)》。2019年内蒙古自治区推出《政务数据资源分级分类指南》征求意见稿及编制说明。
当前国内外对于开放政府数据资源建设的研究也已取得了一定的成果,但是对于开放政府数据过程中政府数据资源分类分级问题尚未引起重视。国内的相关研究主要集中于开放政府数据资源建设的评估,例如涵盖了“数据层”“平台层”等3个层面及具体的“组织和管理”“数据数量”等13个维度的评估框架的提出[2]。国内外开放政府数据资源建设比较研究,例如从资源现状等方面对美英澳加四国和我国平台的对比分析[3];开放政府数据要素框架研究,例如对开放政府数据政策,开放政府数据平台构成要素,包括数据架构等的研究[4];主题类政府数据的开放研究,例如从数据层面分析我国城市政府开放数据在主题视角和区域视角下的利用现状,其中涉及教育科技类数据[5]。 通过对现有政策以及国内研究现状的分析可见,政府数据开放分类分级问题已引起了政府的重视,学者们虽然重视开放政府数据资源建设,但是对于政府数据开放分类分级关注度不够。
我国在开放政府数据实践层面已有众多的开放政府数据平台。2017年我国有18个省级、副省级和地级政府上线开放政府数据平台,2018年有56个,2019年有102个,到2020年上半年已有130个[6]。政府数据开放分类分级的社会需求和政府数据开放分类分级相关政策的制定,引领规范着我国政府数据开放分类分级工作,政府数据开放分类分级主要集中于政府数据开放共享前的分类分级,将分类分级后的可以共享或有条件开放共享的政府数据在开放政府数据平台中开放,在平台中已经开放的数据也需要不断监管。通过政府数据开放分级分类的流程,可见我国政府数据开放分类分级工作实践具体集中展现在开放政府数据平台上。那么,我国开放政府数据平台数据资源分类分级实践究竟如何呢?从实践中反映出我国政府数据开放分类分级如何更好地推进呢?
本文期望通过透视我国开放政府数据平台数据资源分类分级实践表现,思考我国政府数据开放分类分级发展策略。本文选取开放政府数据平台数据资源中教育类数据资源分类分级情况进行调查研究。选取教育类数据的原因是:2015年8月19日,我国国务院常务会议通过《关于促进大数据发展的行动纲要》,其中明確提出,“率先在信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、资源、农业、环境等重要领域实现公共数据资源合理适度向社会开放”[7]。中国软件测评中心发布的《2015年中国政府网站绩效评估》显示,我国公众最为迫切需要的是教育、社保、就业、医疗等方面的数据信息[8]。此外,纵观国内开放政府数据平台可以看到,几乎所有的平台都提供有教育、健康、交通等主题的数据。
为了了解近年来我国开放政府数据平台数据资源分类分级实践情况,分别于2018年、2020年进行了调查,通过调查开放政府数据平台教育主题数据资源分类分级状况这一“点”上的问题,以“点”带“面”,以“点”为辐射,以此探究我国开放政府数据过程中政府数据分类分级存在的问题,以期更好地推动相关工作,促进政府数据价值有效地发挥。
1研究设计
1.1调查对象的确定
我国目前还未建成国家级开放政府数据平台。2017年5月,国内首个地方政府数据开放评估报告《2017中国地方政府数据开放平台报告》显示,上海、贵阳两地在全国19个地方政府开放政府数据平台中表现最好。其中,在省级行政区排名中,指数得分最高的是上海,其次是北京、广东、浙江、贵州;在副省级和地级城市排名中,得分最高的是贵阳,其次是青岛、武汉、东莞、佛山等地[9]。本文选取北京、上海、广东、贵州、青岛、武汉、东莞、贵阳这8个具有典型性和代表性的开放政府数据平台教育数据资源分类分级情况进行调查[10-17],如表1所示。
1.2调查类目的制定
开放政府数据平台数据资源建设的核心是开放政府数据平台数据资源。一端是资源的供给方——政府,供给方供给资源的目的就是通过政府数据资源在开放政府数据平台这一载体上的供给,使政府数据这一生产要素在不危及国家安全、个人隐私等前提下得以充分流动,得以充分利用,发挥其潜能;一端是资源的利用方——公众、企业、政府,利用方利用政府数据资源的目的就是满足其需要。
因为平台数据资源是政府数据资源的一部分,政府数据开放分类分级流程首先是对政府数据的分类分级,分类分级后对完全符合开放要求和附加一定条件方能符合开放要求的政府数据在开放政府数据平台上开放。对于政府数据分类分级的定义目前尚不统一。本文采用如下定义:政府数据分类就是根据政府数据的属性或特征,将其按照一定的原则和方法进行区分和归类,并建立起一定的分类体系和排列顺序,以便更好地管理和使用政府数据的过程。政府数据分级就是按照一定的分级原则对分类后的政府数据进行定级,从而为政府数据的开放和共享安全策略制定提供支撑[18]。可以说,政府数据分类分级两者关系密切,互为表里。开放政府数据平台数据分类分级是在政府数据分类分级基础上,其必然受到政府数据分类分级的指导,体现政府数据分类分级的思想原则等。开放政府数据平台数据分类分级关乎资源供给方对政府数据资产的管理与揭示,以及对政府数据安全的保护,也关乎资源利用方对资源需求的满足。这是促进政府数据利用与保护政府数据安全两者平衡的体现。
由于调查主要针对政府数据开放分类分级实践,即对平台教育类数据分类分级情况进行调查,基于政府数据开放分类分级的内涵与关系,确定开放政府数据平台教育类数据分类分级情况调查类目,对于分类情况的调查,主要是调查教育数据集类目名称、教育数据集所从属的分类方式、教育数据集主题分布;对于分级情况的调查,主要是调查教育数据集分级及用户授权许可协议,此外,因教育数据集提供机构数量及分布,教育数据集数量也在一定程度上间接地反映了分类分级情况,所以也作为调查类目。
1.3调查时间的确定
因为2017年5月,我国首次开展了国内地方政府的开放政府数据评估,所以2018年展开了第一次调查,具体检索时间是2018年4月8日[19]。随着平台建设实践及评估的持续发展,为了不断总结经验教训,2020年展开了第二次调查,具体检索时间是2020年8月2日。通过对实践的两次调查分析,研究开放政府数据平台数据分类分级总体发展情况。
2中国开放政府数据平台数据分类分级调查结果
2.1教育数据集类目名称
两次调查显示:①类目名称变化情况:调查的8个平台除了东莞市从原来没有教育类数据集的相应类目发展为有独立的类目名称“教育科技”外,其余7个平台都和第一次调查的名称一样,没有发生改变;②这7个类目名称无变化的平台,其具体类目名称情况是:青岛市的类目名称是“教育”;北京市是“教育科研”;上海市、广东省、武汉市、贵阳市都是“教育科技”;贵州省是“教育文化”,如表2所示。 2.2数据集分类方式及教育数据集所从属的分类方式
两次调查显示:
1)数据集分类方式情况:在第一次调查中,有6个平台的数据集分类方式都按照主题、提供机构等,只有2个平台,即青岛市和东莞市与其他6个平台的分类方式不同。青岛市提供了领域、部门、格式、接入方式这4种数据集的分类方式。东莞市分类方式别具特色,提供部门、主题、法人、自然人和地理5种分类方式。第二次调查中,北京、上海、东莞和贵阳4个平台与第一次调查相比较,分类方式发生了较为明显的变化。其中,北京、上海、贵阳3个平台新增分类方式,贵阳市增加了行业和服务两种分类方式,东莞分类方式直接发生变化,变成了重点领域、部门、场景(企业)和场景(人)。
2)教育数据集所从属的分类方式情况:在第一次调查中,青岛市的“教育”是“领域”中的一个领域。东莞市的分类方式中,无法明确看到教育数据,但从部门数据中,能够找到东莞市教育局提供的教育数据资源。其他的6个平台中,教育数据是其主题分类中的一类;在第二次调查中,东莞和贵阳这2个平台的教育数据集所属的分类方式有变化,其他平台都同第一次调查一样,其教育数据集所从属的分类方式没有变化,如表3所示。
2.3教育数据集主题分布
两次调查显示:各个平台教育数据集主题分布广泛,在第二次调查时展现出更为广泛的特点。大多数平台教育数据集主题都涵盖有各类教育机构及学校的一些数据,各类科学技术公司或实验室、各类科研项目、申请专利的一些数据,各类学校收费标准,教育科研类比赛获奖信息等。北京、上海、广东、东莞和贵阳这5个平台教育数据集主题基本分布在这些主题内。贵州、青岛、武汉这3个平台的教育数据集主题更为广泛,还包括相关教育主题活动、政策文件、相关部门的基本信息等,如青岛市的“青少年法制教育大讲堂活动”,贵州省的“多彩贵州宣传文化云数据渠道融媒体中心”和“十九大精神与解读”,武汉市的“武汉市民宗委2016年‘三公’经费财政拨款预算情况说明”等。
2.4教育数据集分级及用户授权许可协议
两次调查显示:对于教育数据集的分级,调查平台的数据是可共享的,不是受限共享(只能按照特定方式或提供给指定对象共享的数据资源),也不是非共享(依照法律、法规、规章规定不能共享的数据资源)。平台的教育数据集中,看不到对于数据集的分级情况。在两次调查中,用户授权许可协议对于授予用户权利的相关规定并无明显变化。北京市、青岛市、武汉市、东莞市表述基本相同,表明用户可免费获取网站数据资源,对数据资源享有非排他使用权。贵阳市提出通过平台成功注册的用户,不受歧视的享有免费访问、获取和使用数据资源等权利。各平台都保障用户自由利用、自由传播与分享数据资源的权利,上海市、广东省、青岛市、武汉市、贵阳市明确规定用户不得有偿或无偿转让在本网站中获取的各种数据资源,不得违反国家相关法律规定。第二次调查显示贵州省提出用户有对“完全开放”数据不受限制地进行商业或非商业性利用的权利。
2.5各类数据集及教育数据集数量
两次调查显示:①平台在各类数据集总量方面的变化情况:6个平台,即北京市、上海市、广东省、贵州省、青岛市和武汉市都有所增加,而2个平台,即东莞市和贵阳市则有所下降;②平台在教育数据集数量方面的变化情况:5个平台,即北京市、上海市、广东省、青岛市和武汉市的数量有所增加,而2个平台,即贵州省和贵阳市的数量有所下降,东莞市教育数据集数量变化情况不明。上海市、青岛市发布的教育数据集数量从少于100个变为达到200个以上,北京市、贵州省从小于20个变为达到60个以上,如表4所示。
2.6教育数据集提供机构数量及分布
两次调查显示:①各类数据集提供机构总数方面,调查的6个平台都呈现出增加的状态,只有东莞市和贵阳市2个平台提供机构有所减少。②教育数据集提供机构的总数方面,调查的7个平台都呈现出增加的状态(东莞市情况不明)。③教育数据集提供机构占各类数据集提供机构总数的比例方面则是有增有减,其中北京市、武汉市和贵阳市这3个平台比例有所提高。如贵阳市在第一次调查时,参与数据集提供的机构中有54%的机构都提供了教育类数据集,在第二次调查时参与数据集提供的机构中有74%的机构都提供了教育类数据集;其中上海市、广东省、贵州省和青岛市这4个平台比例有所降低,如广东省由50%变为35%;东莞市的平台情况不明。此外,北京市的平台在第一次调查时显示,参与教育科研数据资源提供的机構被分为3类:教育机构、科研单位、培训机构,第二次调查时没有做出对参与教育科研数据资源提供机构的分类,调查的其他平台对参与教育数据资源提供的机构一直没有进行分类。
3我国开放政府数据平台数据分类分级调查结果的分析
结合我国中央政策文件《政务信息资源目录编制指南(试行)》《政务信息系统整合共享实施方案的通知》等,并结合我国地方性政策文件,如贵州省的《政府数据分类分级指南》,上海市的《上海市公共数据开放分级分类指南(试行)》等,通过对政策文件中涉及政府数据分类分级的规定进行分析,考量8个开放政府数据平台数据分类分级两次调查结果,发现近年来我国政府数据开放分类分级实践存在一些问题。
3.1开放政府数据平台数据分类存在的问题
开放政府数据平台分类无疑受到相关政策文件的规范和指导,通过这些政策文件审视平台数据分类情况,主要存在分类维度、不同分类维度下“类”“项”“目”“细目”组成问题。
3.1.1教育数据集类目名称的分析
从对教育数据集类目名称两次调查可见,如表2所示,仅仅就“教育”这一类的数据而言,“教育”类数据的内涵究竟是什么?外延究竟是什么?教育和教育科研、教育文化、教育科技它们之间的区别又在哪里?调查平台的“教育科技”“教育文化”等类目下,也没有进一步划分“教育”“文化”“科技”等。《政务信息系统整合共享实施方案的通知》提出:“建立物理分散、逻辑集中、资源共享、政企互联的政务信息资源大数据,构建深度应用、上下联动、纵横协管的协同治理大系统”[20]。我国要建立“逻辑集中”的政务信息资源大数据。《政务信息资源目录编制指南(试行)》提出:“主题信息资源目录是围绕经济社会发展的同一主题领域,由多部门共建项目形成的政务信息资源目录”[21]。我国要建立“主题信息资源目录”。贵州省的《政府数据分类分级指南》附表是贵州省政府数据按主题分类表,“科技、教育”是第14个大类。由此可见,开放政府数据平台数据资源主题类别的确定仅仅有以上文件的指导还是不够的,还需要在建设中明确政府数据分类分级中对于政府数据资源分类如果按主题来划分,主题类别究竟划分多少个类目,具体包含哪些类目才是合理的、科学的。 3.1.2数据集分类方式及教育数据集所从属的分类方式的分析
从对数据集分类方式及教育数据集所从属的分类方式两次调查可见,如表3所示,调查的平台在数据集分类方式上,主要提供的分类方式是按照主题、按照提供机构等,贵阳市新增了行业和服务两种分类方式,东莞分类方式直接发生变化,原来的分类方式是:部门、主题、法人、自然人和地理,之后的分类方式是:重点领域、部门、场景(企业)和场景(人)。由此可见,东莞市第一次调查时显示的分类方式与《政务信息资源目录编制指南(试行)》对政务信息资源目录的分类也有一定相似之处。《政务信息资源目录编制指南(试行)》提出:政务信息资源目录按资源属性分为基础信息资源目录、主题信息资源目录、部门信息资源目录3种类型。上海市试行的《上海市公共数据开放分级分类指南(试行)》对公共数据的开放级别按照公共数据描述的对象,从个人、组织、客体这3个维度分别展开,并对3个维度下具体的开放级别、数据特征、数据示例、开放类型给出了详细的列表[22]。
实际上,无论教育数据集从属于哪种分类方式,无论数据资源采用了什么分类方式,其目的是为了政府更好地管理数据资源,保障数据安全,促进用户更好地利用数据资源。数据资源的管理需要“逻辑集中”,需要有效揭示,所以政府数据开放分类分级中的分类方式需要有一定的标准和依据,需要很好地对接政府数据分级,体现科学性、逻辑性、有效性,既有相对的稳定性又有随着实际需要的变化性。
3.1.3教育数据集主题分布的分析
从教育数据集主题分布两次调查可见,如表3所示,各个平台教育数据集主题分布极其广泛,不仅有教育管理基础数据、教育行政管理数据、普通中小学校管理数据、教育统计数据,还有各类科学技术公司、实验室、科研项目以及相关政策文件的信息等。平台提供的教育类数据资源具体主题有的真正涉及到教育相关的内容,但是也有许多与教育主题关系不大,如“2015年4季度建筑材料质量抽查不合格产品名单”等与教育主题不符。虽然《政务信息资源目录编制指南(试行)》明确了政务信息资源代码结构规则,提出政务信息资源代码结构由前段码、后段码组成。前段码由“类”“项”“目”“细目”组成[21]。然而,调查的平台不仅没有很明确开放政府数据平台数据资源的“类”,而且没有理清楚类下面的“项”“目”“细目”具体组成是什么,所以平台教育数据集主题广泛,内容非常庞杂。虽然《促进大数据发展行动纲要》提出:“完善教育管理公共服务平台,推动教育基础数据的伴随式收集和全国互通共享……推动形成覆盖全国、协同服务、全网互通的教育资源云服务体系”[23],但是这一问题造成实现教育基础数据全国互通共享存在一定困难。
3.2平台数据分类与政策文件数据分类分级的统一性及衔接性问题
实际上,目前各个政策文件数据分类分级在规范性方面也不统一。中央文件《关于构建更加完善的要素市场化配置体制机制的意见》指出:“要推动完善适用于大数据环境下的数据分类分级安全保护制度”。地方性文件主要有上海市的《上海市公共数据开放分级分类指南(试行)》,贵州省的《政府数据分类分级指南》,内蒙古的《政务数据资源分级分类指南》。3个地方性文件都在开篇指出制定指南的目的是保障政府机构开放和共享政府数据;贵州省定义了“政府数据分类”“政府数据分级”的概念,内蒙古定义了“政务数据分类”“政务数据分级”的概念,上海市定义了“公共数据开放分级”“公共数据开放分类”的概念;贵州省和内蒙古都在定义中明确了首先对政府数据分类,在此基础上进行分级。贵州省的分类方式是主题、行业和服务3个维度,政府数据的分级由数据的敏感程度划分,可分为:非敏感数据、涉及用户隐私数据、涉及国家秘密数据,3类数据采取的管控要求不同,对应分为:公开数据、内部数据、涉密数据,相应采用不同共享要求。内蒙古的分类方式是基础数据资源类、主题数据资源类及部门数据资源类3个维度[24],其政府数据的分级、管控要求、不同共享要求基本上与贵州省类似。上海市的公共数据开放分级是依据公共数据安全要求、个人信息保护要求和应用要求等因素,将公共数据分为不同级别的管理方式。公共数据开放分类是将公共数据分为无条件开放、有条件开放、非开放3种开放类别的管理方式。分级分类规则中公共数据的开放级别按照公共数据描述的对象,从3个维度分别展开:个人、组织、客体[22]。
通过分析可见,目前我国已明确为了保障开放政府数据过程中的数据安全及数据流动,解决政府数据开放分类分级问题是非常重要的,但是政府数据分类、政府数据分级概念还不太明晰,两者之间的关系也没有完全确定。实际上,上海市的公共数据开放分类方法,在贵州、内蒙古两地,将其作为政府数据分级。各地区对于数据分类概念、具体维度也不统一。
所调查平台的分类方式基本上与贵州、内蒙古的文件中的分类方式一致,东莞市分类方式与上海市的文件中的分类方式有一致性。那么,如何通过多种分类方式揭示数据资源以及政府数据开放分类分级中的分类方式,如何衔接开放政府数据平台中的政府数据分类方式,这都需要进一步思考。
3.3教育数据集分级及用户授权许可协议存在的问题
調查的平台所提供的数据资源,对所有用户(贵阳市要求用户注册)都是“可共享”,不是“受限共享”,也不是“非共享”。平台没有展现出数据分级,也没有限定各等级的数据的开放共享程度,没有区分出一些数据是可以完全共享的数据,一些数据是可以适当共享,一些数据是只对确需获取该级数据的授权机构及相关人员开放,一些数据原则上不共享。《意见》提出“建立统一规范的数据管理制度”“制定数据隐私保护制度和安全审查制度”“推动完善……数据分类分级安全保护制度”[25]。目前,开放政府数据平台数据资源缺乏安全风险评估,授予用户的权利不明确不充分,不同类型数据的授权许可也是缺失的。
3.4政府机构参与政府数据开放分类分级存在的问题 从各类数据集及教育数据集数量两次调查可见,如表4所示,在2018—2020年间,我国开放政府数据平台数据集总量和教育数据集数量总体上呈现上升的趋势。调查的6个平台在各类数据集总量方面都有所增加,而2个平台有所下降,调查的5个平台在教育数据集数量方面有所增加,而2个平台有所下降(其中一个平台变化情况不明)。教育数据集数量占所有数据集数量的比例并不高。
从教育数据集提供机构分布两次调查可见,如表5所示,各平台的教育数据资源参与机构也是各不相同,差异非常大。调查的各平台都有教育厅、教育局或教育委员会的参与,但是有些平台教育局或教育厅不是教育数据资源提供的主要机构,如广东省、贵州省。两年间平台教育数据集提供机构之间协同有所改进,但还有不足,调查的4个省级平台显示:相较于第一次调查,从只有广东省这1个平台到有3个平台(除北京市)显示与其所辖区有协作,其中,广东省的平台与东莞市的平台在教育数据集建设中从之间无关系变为东莞市向省级平台提供了3个教育数据集。调查的4个副省级和地级市的平台显示:相较于第一次调查,青岛市的平台中,区级机构提供教育数据资源方面从无到有,武汉市、贵阳市的平台中,有更多的区级机构参与了协作,但是所辖区及机构提供的数据集数量有限。2017年5月,国务院办公厅印发的《政务信息系统整合共享实施方案》提出:围绕落实国家政务信息化工程相关规划,建设“大平台、大数据、大系统”,形成覆盖全国、统筹利用、统一接入的数据共享大平台……构建深度应用、上下联动、纵横协管的协同治理大系统[23],由此可见,如何建设“大平台、大数据、大系统”,如何实现“上下联动、纵横协管的协同治理大系统”,如何在开放政府数据平台数据分类分级中实现政府机构协同参与,实现协同治理大系统这一问题还有待解决。
4我国政府数据开放分类分级发展策略
4.1加强我国政府数据开放分类分级的顶层设计
虽然我国中央政府层面的文件《关于构建更加完善的要素市场化配置体制机制的意见》,贵州省的《政府数据分类分级指南》,上海市的《上海市公共数据开放分级分类指南(试行)》等地方性文件明确了政府数据开放分类分级,以及目前已发布的《政务信息资源目录体系》《政务信息资源交换体系》等政策文件也涉及政府数据开放分类分级相关的内容,但是政策文件中关于政府数据开放分类分级的概念不明确,虽然在分级中都考虑到政府数据对国家安全、社会稳定和公民安全的重要程度,以及数据是否涉及国家秘密、是否涉及用户隐私等敏感信息,但是实践中政府数据开放分类分级的方法有很大相同。
各开放政府数据平台所采用的分类方式各不相同。一个开放政府数据平台的数据分类往往可能与另外一个平台的数据分类差别很大。因为平台上没有对可完全开放数据和可以附加一定条件开放的数据进行分级显示,所以在数据分级方面基本没有差别。我国当前130个地方政府数据开放平台系统各异、各数据集异构分散、有可能造成开放的政府数据价值的流失、数据流通安全方面的隐患等,不利于用户的利用,也很难使政府数据成为市场有效流动、交换共享的要素。我国当前政府数据开放分类分级管理标准化科学化管理缺乏全局性。当务之急是从宏观层面对我国政府数据开放分类分级管理进行统一规划建设,这就需要“顶层设计”这样的方法。
我国政府数据开放分类分级的顶层设计就是从全局视角出发,从国家层面出发,围绕着未来构建国家一體的开放政府数据大平台,在保障数据安全的前提下,充分发挥数据生产要素价值的核心目标,对政府数据开放分类分级框架进行统筹规划,确定各组成部分和各要素,涵盖政府数据开放分类分级标准指南的确立、对行政系统实施管理、自上而下地解决政府数据开放分类分级的各种问题,进而形成一个完整的标准化的科学的体系,推动我国政府数据开放分类分级的进程。各开放政府数据平台“自下而上”地开展政府数据开放分类分级的路径虽然有助于自身平台数据资源分类安全工作,但是不足以支撑国家“大平台、大数据、大系统”的建设,不足以支撑国家安全观视阈下的数据安全管理[26],所以,国家对政府数据开放分类分级管理,需要通过“自上而下”的方式。
4.2分类分级一体化思想下政府数据开放分类标准的制定
政府数据资源庞大,政府数据类型众多,可将其按不同的方式进行分类。从不同分类角度审视政府数据,则不同分类下的政府数据的数量、范围、类型、结构及所包含的内容就各不相同。《促进大数据发展行动纲要》明确提出:“优先推动信用、交通、医疗……文化、教育、科技、资源、农业……等民生保障服务相关领域的政府数据集向社会开放”[21],开放政府数据平台建设中究竟以“教育”为一类,还是以“教育科技”或“教育文化”等为一类呢?此外,教育数据可再细分,可以分为基础数据、状态数据、资源数据和行为数据,也可以分为学生数据、课程数据、用户生成的数据、政府数据与机构数据,还可以分为个体数据、课程数据、学校数据、区域数据、国家数据等。由此可见,明确政府数据资源的分类体系,各类的内涵,确定不同“类”下面的“项”“目”“细目”是迫切需要解决的问题,明确哪些基础数据不涉及敏感信息可以开放,哪些涉及敏感信息不能开放等问题也需要解决。
开放政府数据平台分类标准的缺失造成了各地开放政府数据平台分类方式、类目名称、数据资源主题分布等的主观随意性,影响了公众对开放政府数据资源的利用,影响了数据的分级,影响了“形成覆盖全国、统筹利用、统一接入的数据共享大平台”的建设进程,影响了我国政府数据开放的整体水平。
虽然,我国《政务信息资源目录编制指南(试行)》提出:政务信息资源目录分类包括资源属性分类、涉密属性分类、共享属性分类和层级属性分类[21],且以资源属性为角度,对政务信息资源目录划分为基础信息资源目录、主题信息资源目录、部门信息资源目录。那么,有多少政府数据资源?政府数据资源如何分布?政府数据资源可以有哪些分类方式?不同分类方式下究竟包含哪些数据呢?什么是敏感的政府数据,敏感的政府数据在哪里?政府部门可以提供哪些数据资源?因为不同的分类方式取决于要开放和保护的数据的价值和内容,不同的分类方式形成了不同类别的数据,而对于不同类别的数据,保护的主体、方式和程度也是不一样的。同一数据在不同场景中也会被纳入不同的分类。基于政府数据保护与利用平衡视角下的政府数据开放分类需要以分类分级一体化思想为指导,进而制定出政府数据开放分类分级中的“我国开放政府数据平台数据资源分类标准”,可发布《我国政府数据资源分类法》图书或指南,与政府数据开放分级相配合,与描述开放数据集和数据资源的核心元数据标准相配合,应用于指导我国政府数据开放分类分级中数据资源的分类组织工作。 4.3分类分级一体化思想下政府数据开放分级标准及用户授权许可协议的制定
虽然《政务信息资源目录编制指南(试行)》提出:“政务信息资源目录按共享类型分为无条件共享、有条件共享、不予共享3种类型”,其依据是“可提供给所有政务部门共享使用”或者“可提供给相关政务部门共享使用或仅能够部分提供给所有政务部门共享使用”或者“不宜提供给其他政务部门共享使用”[21],其依据也就是数据共享的对象或是所有政务部门,或是相关政务部门,或是无其他政务部门。上海市的《上海市公共数据开放分级分类指南(试行)》提出了数据集在个人、组织、客体3个维度下的不同开放级别和不同开放类别。贵州省的《政府数据分类分级指南》提出,依数据的敏感程度将政府数据分级为:公共数据、内部数据、涉密数据。不同数据等级数据对于开放和共享提出的要求也不同。
政府数据开放共享的对象有政务部门、公众、企业。我国没有国家层面政府数据开放分类分级中分级的具体标准以及开放政府数据平台数据资源用户授权许可协议,没有对政府数据安全分级详细规定,没有对政府非涉密但敏感数据的规定,所调查的开放政府数据平台其提供的数据资源没有任何按共享类型的划分,所提供的资源用户都可以免费使用(贵阳的平台需注册)。开放共享的政府数据安全关乎国家安全、社会稳定、公众和个人安全,与我国公民权益息息相关。此外,一些政府机构不愿意开放政府数据资源,其中一个原因就是担心开放数据不当而引发数据侵权、数据滥用等风险事件,由此可见,平衡政府数据的开放与安全保护是非常重要的,制定政府数据开放分级标准及用户授权许可协议是现实需要。政府在制定数据资产分类分级清单过程中,通过开放政府数据的风险评估,依据标准列出数据的访问级别:开放、受限开放、不开放。对于“受限开放”数据,在其字段中须填写如何获得访问的详细信息,对于“不开放”数据,要说明其无法开放的原因,保障政府机构在开放政府数据过程中能确定以适当的策略方式,保护数据的可用性、完整性及保密性[21],依据政府数据开放分级标准开放合规的数据,按要求公布政府数据开放目录,通过在线完全下载或部分下载、离线共享或定制服务等方式向社会开放共享政府数据资源。
4.4健全政府数据开放分类分级管理的组织体系并加强分类分级工作的协同
虽然各地在大数据管理局等负责下推进开放政府数据过程中政府数据资源建设,但是,开放政府数据平台数据分类分级中体现出各个平台之间,各平台其资源建设机构之间,上下级间、同级间缺乏有效的协调,由此使得各平台在数据分类分级中互不相干、各行其是。针对上述问题,在我国政府数据开放分类分级顶层设计方法的指导下,建立健全我国政府数据开放数据资源管理体制,可在国家信息中心下设政府数据开放分类分级管理部门,分类分级管理部门负责确定政府数据开放分类标准、分级标准、制定相关制度和流程,监督各地开放政府数据平台负责机构对政府数据资源分类分级的实施,促进建立协同式的开放政府数据平台数据资源分类分级管理协同机制,协助相关政府部门创建政府数据清单,进行开放政府数据风险识别与风险评估、确定开放政府数据平臺数据访问级别。政府数据开放分类分级管理围绕公众需求和公众服务,支持政府部门和公众围绕开放政府数据平台建立双向互动交流模式,保护政府数据在开放共享中的安全,对内让数据要素充分流动,同时对外保障开放共享的政府数据资源不危及国家安全与公共利益。
参考文献
[1]中共中央国务院.关于构建更加完善的要素市场化配置体制机制的意见[EB/OL].http://www.xinhuanet.com//mrdx/2020-04/10/c_138964 212.htm,2020-04-12.
[2]郑磊,高丰.中国开放政府数据平台研究:框架、现状与建议[J].电子政务,2015,(7):8-16.
[3]吴钢,曾丽莹.国内外政府开放数据平台建设比较研究[J].情报资料工作,2016,(6):75-79.
[4]陈美.面向增值利用的政府开放数据平台顶层设计研究[J].图书馆,2019,(8):23-28.
[5]段尧清,邱雪婷,何思奇.主题与区域视角下我国城市政府开放数据利用现状分析[J].图书情报工作,2018,62(20):65-76.
[6]新华网.“2020中国开放数林指数”在线发布[EB/OL].http://sh.xinhuanet.com/2020-07/22/c_139232360.htm,2020-07-31.
[7]中共中央国务院.国务院关于印发促进大数据发展行动纲要的通知[EB/OL].http://news.163.com/15/0906/09/B2QO1JKJ 00014SEH.html,2020-05-06.
[8]人民网.中国软件评测中心发布2015政府网站绩效评估结果[EB/OL].http://politics.people.com.cn/n/2015/1210/c1001-279085 67.html,2020-07-31.
[9]东方网.复旦发布国内首个地方政府数据开放指数 上海开放程度全国第一[EB/OL].http://shzw.eastday.com/shzw/G/20170605/u1ai10626299.html,2020-07-31.
[10]北京市政务数据资源网[EB/OL].https://data.beijing.gov.cn/,2020-08-02.
[11]上海市公共数据开放平台[EB/OL].https://data.sh.gov.cn/,2020-08-02.
[12]开放广东[EB/OL].http://gddata.gd.gov.cn/,2020-08-02.
[13]贵州省政府数据开放平台[EB/OL].http://data.guizhou.gov.cn/#!/,2020-08-02. [14]青岛公共数据开放网[EB/OL].http://data.qingdao.gov.cn/,2020-08-02.
[15]武汉市公共数据开放平台[EB/OL].http://www.wuhandata.gov.cn/whData/index.html,2020-08-02.
[16]数据东莞[EB/OL].http://dataopen.dg.gov.cn/dataopen/,2020-08-02.
[17]贵阳市政府数据开放平台[EB/OL].https://data.guiyang.gov.cn/city/index.htm,2020-08-02.
[18]百度文库.政府数据数据分类分级指南(征求意见稿)[EB/OL].https://wenku.baidu.com/view/b754c9bd9fc3d5bbfd 0a79563c1ec5da50e2d69d.html,2020-08-03.
[19]赵润娣.大数据时代政府数据开放与共享研究——基于开放政府数据平台中教育数据开放与共享现状的调查[A].鲍静.大数据与公共服务[C].2020.
[20]中共中央国务院.国务院办公厅关于印发政务信息系统整合共享实施方案的通知(国办发〔2017〕39号)[EB/OL].http://www.gov.cn/zhengce/content/2017-05/18/content_51949 71.htm?gs_ws=tsina_636308006794141816,2020-04-16.
[21]国家发展改革委中央网信办.关于印发《政务信息资源目录编制指南(试行)》的通知[EB/OL].http://www.gov.cn/xinwen/2017-07/13/content_5210203.htm,2020-05-10.
[22]道客巴巴.上海市公共数据开放分级分类指南(试行)[EB/OL].https://www.doc88.com/p-6651645226630.html,2020-08-03.
[23]中共中央国务院.国务院关于印发促进大数据发展行动纲要的通知[EB/OL].http://news.163.com/15/0906/09/B2QO1 JKJ00014SEH.html,2020-05-06.
[24]道客巴巴.政務数据资源分级分类指南[EB/OL].https://www.doc88.com/p-9942943598081.html,2020-08-03.
[25]中共中央国务院.关于构建更加完善的要素市场化配置体制机制的意见[EB/OL].http://www.xinhuanet.com//mrdx/2020-04/10/c_1389642 12.htm,2020-04-12.
[26]对《数据安全法》的理解和认识|数据分级分类[EB/OL].https://mp.weixin.qq.com/s?src=11
基金项目:国家社会科学基金项目“开放政府数据的风险识别、评估及防控体系研究”(项目编号:18XTQ010);甘肃省社会科学规划一般项目“开放政府数据背景下甘肃开放政府数据发展策略研究”(项目编号:YB057);甘肃省“十三五”教育科学规划重点课题“甘肃省教育数据开放研究”(项目编号:GS[2017]GHBZ038)。
作者簡介:赵润娣(1975-),女,副教授,博士,硕士生导师,研究方向:数字政府治理、公共危机信息管理。
摘要:[目的/意义]近年来在全球开放政府数据浪潮中,中国政府持续推进政府数据开放与利用。开放政府数据过程中政府数据开放分类分级,对保障政府数据安全、促进政府数据充分流动、发挥政府数据潜能具有重要意义。[方法/过程]本文聚焦于中国开放政府数据过程中政府数据资源分类分级问题,在2018年和2020年,对我国8个开放政府数据平台教育主题数据资源分类分级状况进行了两次调查。[结果/结论]通过分析我国开放政府数据平台数据资源分类分级实践表现,探究我国政府数据开放分类分级存在的问题,进而提出我国开放政府数据过程中政府数据资源分类分级发展策略。
关键词:开放政府数据;数据资源;分类分级;开放政府数据平台;教育数据
DOI:10.3969/j.issn.1008-0821.2021.04.010
〔中图分类号〕D035-39〔文献标识码〕A〔文章编号〕1008-0821(2021)04-0090-11
Research on the Classification and Hierarchization of
Open Government Data Resources in China
——Based on Surveys of Educational Data of Open Government Data Portals
Zhao Rundi
(College of Social Development and Public Administration,Northwest Normal University,
Lanzhou 730070,China)
Abstract:[Purpose/Significance]In recent years,With the global wave of open government data,China has continued to promote the openness and utilization of government data.It is important to ensure government data security and promote government data flow fully through classification and hierarchization of government data.[Method/Process]This paper focused on classification and hierarchization of government data resources during China open government data process.In 2018 and 2020,two surveys were conducted on the classification and hierarchization of educational subject data resources on eight open government data portals.[Result/Conclusion]Through analyzing the classification and hierarchization practice,this paper explored problems existing in the classification and hierarchization of data resources of open government data,and then put forward the development strategy of classification and hierarchization of government data resources during China open government data process.
Key words:open government data;data resources;classification and hierarchization;open government data portal;education data
近年来,我国从中央政府到地方政府都在积极推进开放政府数据资源建设。开放政府数据过程中政府数据资源分类分级引起了政策层面一定的关注。2017年国务院办公厅发布《国务院办公厅关于印发政务信息系统整合共享实施方案的通知》。2018年国家发展改革委、中央网信办印发《政务信息资源目录编制指南(试行)》。2020年中共中央、国务院印发《关于构建更加完善的要素市场化配置体制机制的意见》,其中指出“要推动完善适用于大数据环境下的数据分类分级安全保护制度”[1]。2016年贵州省出台《政府数据分类分级指南》。2019年上海市试行《上海市公共数据开放分级分类指南(试行)》。2019年内蒙古自治区推出《政务数据资源分级分类指南》征求意见稿及编制说明。
当前国内外对于开放政府数据资源建设的研究也已取得了一定的成果,但是对于开放政府数据过程中政府数据资源分类分级问题尚未引起重视。国内的相关研究主要集中于开放政府数据资源建设的评估,例如涵盖了“数据层”“平台层”等3个层面及具体的“组织和管理”“数据数量”等13个维度的评估框架的提出[2]。国内外开放政府数据资源建设比较研究,例如从资源现状等方面对美英澳加四国和我国平台的对比分析[3];开放政府数据要素框架研究,例如对开放政府数据政策,开放政府数据平台构成要素,包括数据架构等的研究[4];主题类政府数据的开放研究,例如从数据层面分析我国城市政府开放数据在主题视角和区域视角下的利用现状,其中涉及教育科技类数据[5]。 通过对现有政策以及国内研究现状的分析可见,政府数据开放分类分级问题已引起了政府的重视,学者们虽然重视开放政府数据资源建设,但是对于政府数据开放分类分级关注度不够。
我国在开放政府数据实践层面已有众多的开放政府数据平台。2017年我国有18个省级、副省级和地级政府上线开放政府数据平台,2018年有56个,2019年有102个,到2020年上半年已有130个[6]。政府数据开放分类分级的社会需求和政府数据开放分类分级相关政策的制定,引领规范着我国政府数据开放分类分级工作,政府数据开放分类分级主要集中于政府数据开放共享前的分类分级,将分类分级后的可以共享或有条件开放共享的政府数据在开放政府数据平台中开放,在平台中已经开放的数据也需要不断监管。通过政府数据开放分级分类的流程,可见我国政府数据开放分类分级工作实践具体集中展现在开放政府数据平台上。那么,我国开放政府数据平台数据资源分类分级实践究竟如何呢?从实践中反映出我国政府数据开放分类分级如何更好地推进呢?
本文期望通过透视我国开放政府数据平台数据资源分类分级实践表现,思考我国政府数据开放分类分级发展策略。本文选取开放政府数据平台数据资源中教育类数据资源分类分级情况进行调查研究。选取教育类数据的原因是:2015年8月19日,我国国务院常务会议通过《关于促进大数据发展的行动纲要》,其中明確提出,“率先在信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、资源、农业、环境等重要领域实现公共数据资源合理适度向社会开放”[7]。中国软件测评中心发布的《2015年中国政府网站绩效评估》显示,我国公众最为迫切需要的是教育、社保、就业、医疗等方面的数据信息[8]。此外,纵观国内开放政府数据平台可以看到,几乎所有的平台都提供有教育、健康、交通等主题的数据。
为了了解近年来我国开放政府数据平台数据资源分类分级实践情况,分别于2018年、2020年进行了调查,通过调查开放政府数据平台教育主题数据资源分类分级状况这一“点”上的问题,以“点”带“面”,以“点”为辐射,以此探究我国开放政府数据过程中政府数据分类分级存在的问题,以期更好地推动相关工作,促进政府数据价值有效地发挥。
1研究设计
1.1调查对象的确定
我国目前还未建成国家级开放政府数据平台。2017年5月,国内首个地方政府数据开放评估报告《2017中国地方政府数据开放平台报告》显示,上海、贵阳两地在全国19个地方政府开放政府数据平台中表现最好。其中,在省级行政区排名中,指数得分最高的是上海,其次是北京、广东、浙江、贵州;在副省级和地级城市排名中,得分最高的是贵阳,其次是青岛、武汉、东莞、佛山等地[9]。本文选取北京、上海、广东、贵州、青岛、武汉、东莞、贵阳这8个具有典型性和代表性的开放政府数据平台教育数据资源分类分级情况进行调查[10-17],如表1所示。
1.2调查类目的制定
开放政府数据平台数据资源建设的核心是开放政府数据平台数据资源。一端是资源的供给方——政府,供给方供给资源的目的就是通过政府数据资源在开放政府数据平台这一载体上的供给,使政府数据这一生产要素在不危及国家安全、个人隐私等前提下得以充分流动,得以充分利用,发挥其潜能;一端是资源的利用方——公众、企业、政府,利用方利用政府数据资源的目的就是满足其需要。
因为平台数据资源是政府数据资源的一部分,政府数据开放分类分级流程首先是对政府数据的分类分级,分类分级后对完全符合开放要求和附加一定条件方能符合开放要求的政府数据在开放政府数据平台上开放。对于政府数据分类分级的定义目前尚不统一。本文采用如下定义:政府数据分类就是根据政府数据的属性或特征,将其按照一定的原则和方法进行区分和归类,并建立起一定的分类体系和排列顺序,以便更好地管理和使用政府数据的过程。政府数据分级就是按照一定的分级原则对分类后的政府数据进行定级,从而为政府数据的开放和共享安全策略制定提供支撑[18]。可以说,政府数据分类分级两者关系密切,互为表里。开放政府数据平台数据分类分级是在政府数据分类分级基础上,其必然受到政府数据分类分级的指导,体现政府数据分类分级的思想原则等。开放政府数据平台数据分类分级关乎资源供给方对政府数据资产的管理与揭示,以及对政府数据安全的保护,也关乎资源利用方对资源需求的满足。这是促进政府数据利用与保护政府数据安全两者平衡的体现。
由于调查主要针对政府数据开放分类分级实践,即对平台教育类数据分类分级情况进行调查,基于政府数据开放分类分级的内涵与关系,确定开放政府数据平台教育类数据分类分级情况调查类目,对于分类情况的调查,主要是调查教育数据集类目名称、教育数据集所从属的分类方式、教育数据集主题分布;对于分级情况的调查,主要是调查教育数据集分级及用户授权许可协议,此外,因教育数据集提供机构数量及分布,教育数据集数量也在一定程度上间接地反映了分类分级情况,所以也作为调查类目。
1.3调查时间的确定
因为2017年5月,我国首次开展了国内地方政府的开放政府数据评估,所以2018年展开了第一次调查,具体检索时间是2018年4月8日[19]。随着平台建设实践及评估的持续发展,为了不断总结经验教训,2020年展开了第二次调查,具体检索时间是2020年8月2日。通过对实践的两次调查分析,研究开放政府数据平台数据分类分级总体发展情况。
2中国开放政府数据平台数据分类分级调查结果
2.1教育数据集类目名称
两次调查显示:①类目名称变化情况:调查的8个平台除了东莞市从原来没有教育类数据集的相应类目发展为有独立的类目名称“教育科技”外,其余7个平台都和第一次调查的名称一样,没有发生改变;②这7个类目名称无变化的平台,其具体类目名称情况是:青岛市的类目名称是“教育”;北京市是“教育科研”;上海市、广东省、武汉市、贵阳市都是“教育科技”;贵州省是“教育文化”,如表2所示。 2.2数据集分类方式及教育数据集所从属的分类方式
两次调查显示:
1)数据集分类方式情况:在第一次调查中,有6个平台的数据集分类方式都按照主题、提供机构等,只有2个平台,即青岛市和东莞市与其他6个平台的分类方式不同。青岛市提供了领域、部门、格式、接入方式这4种数据集的分类方式。东莞市分类方式别具特色,提供部门、主题、法人、自然人和地理5种分类方式。第二次调查中,北京、上海、东莞和贵阳4个平台与第一次调查相比较,分类方式发生了较为明显的变化。其中,北京、上海、贵阳3个平台新增分类方式,贵阳市增加了行业和服务两种分类方式,东莞分类方式直接发生变化,变成了重点领域、部门、场景(企业)和场景(人)。
2)教育数据集所从属的分类方式情况:在第一次调查中,青岛市的“教育”是“领域”中的一个领域。东莞市的分类方式中,无法明确看到教育数据,但从部门数据中,能够找到东莞市教育局提供的教育数据资源。其他的6个平台中,教育数据是其主题分类中的一类;在第二次调查中,东莞和贵阳这2个平台的教育数据集所属的分类方式有变化,其他平台都同第一次调查一样,其教育数据集所从属的分类方式没有变化,如表3所示。
2.3教育数据集主题分布
两次调查显示:各个平台教育数据集主题分布广泛,在第二次调查时展现出更为广泛的特点。大多数平台教育数据集主题都涵盖有各类教育机构及学校的一些数据,各类科学技术公司或实验室、各类科研项目、申请专利的一些数据,各类学校收费标准,教育科研类比赛获奖信息等。北京、上海、广东、东莞和贵阳这5个平台教育数据集主题基本分布在这些主题内。贵州、青岛、武汉这3个平台的教育数据集主题更为广泛,还包括相关教育主题活动、政策文件、相关部门的基本信息等,如青岛市的“青少年法制教育大讲堂活动”,贵州省的“多彩贵州宣传文化云数据渠道融媒体中心”和“十九大精神与解读”,武汉市的“武汉市民宗委2016年‘三公’经费财政拨款预算情况说明”等。
2.4教育数据集分级及用户授权许可协议
两次调查显示:对于教育数据集的分级,调查平台的数据是可共享的,不是受限共享(只能按照特定方式或提供给指定对象共享的数据资源),也不是非共享(依照法律、法规、规章规定不能共享的数据资源)。平台的教育数据集中,看不到对于数据集的分级情况。在两次调查中,用户授权许可协议对于授予用户权利的相关规定并无明显变化。北京市、青岛市、武汉市、东莞市表述基本相同,表明用户可免费获取网站数据资源,对数据资源享有非排他使用权。贵阳市提出通过平台成功注册的用户,不受歧视的享有免费访问、获取和使用数据资源等权利。各平台都保障用户自由利用、自由传播与分享数据资源的权利,上海市、广东省、青岛市、武汉市、贵阳市明确规定用户不得有偿或无偿转让在本网站中获取的各种数据资源,不得违反国家相关法律规定。第二次调查显示贵州省提出用户有对“完全开放”数据不受限制地进行商业或非商业性利用的权利。
2.5各类数据集及教育数据集数量
两次调查显示:①平台在各类数据集总量方面的变化情况:6个平台,即北京市、上海市、广东省、贵州省、青岛市和武汉市都有所增加,而2个平台,即东莞市和贵阳市则有所下降;②平台在教育数据集数量方面的变化情况:5个平台,即北京市、上海市、广东省、青岛市和武汉市的数量有所增加,而2个平台,即贵州省和贵阳市的数量有所下降,东莞市教育数据集数量变化情况不明。上海市、青岛市发布的教育数据集数量从少于100个变为达到200个以上,北京市、贵州省从小于20个变为达到60个以上,如表4所示。
2.6教育数据集提供机构数量及分布
两次调查显示:①各类数据集提供机构总数方面,调查的6个平台都呈现出增加的状态,只有东莞市和贵阳市2个平台提供机构有所减少。②教育数据集提供机构的总数方面,调查的7个平台都呈现出增加的状态(东莞市情况不明)。③教育数据集提供机构占各类数据集提供机构总数的比例方面则是有增有减,其中北京市、武汉市和贵阳市这3个平台比例有所提高。如贵阳市在第一次调查时,参与数据集提供的机构中有54%的机构都提供了教育类数据集,在第二次调查时参与数据集提供的机构中有74%的机构都提供了教育类数据集;其中上海市、广东省、贵州省和青岛市这4个平台比例有所降低,如广东省由50%变为35%;东莞市的平台情况不明。此外,北京市的平台在第一次调查时显示,参与教育科研数据资源提供的机構被分为3类:教育机构、科研单位、培训机构,第二次调查时没有做出对参与教育科研数据资源提供机构的分类,调查的其他平台对参与教育数据资源提供的机构一直没有进行分类。
3我国开放政府数据平台数据分类分级调查结果的分析
结合我国中央政策文件《政务信息资源目录编制指南(试行)》《政务信息系统整合共享实施方案的通知》等,并结合我国地方性政策文件,如贵州省的《政府数据分类分级指南》,上海市的《上海市公共数据开放分级分类指南(试行)》等,通过对政策文件中涉及政府数据分类分级的规定进行分析,考量8个开放政府数据平台数据分类分级两次调查结果,发现近年来我国政府数据开放分类分级实践存在一些问题。
3.1开放政府数据平台数据分类存在的问题
开放政府数据平台分类无疑受到相关政策文件的规范和指导,通过这些政策文件审视平台数据分类情况,主要存在分类维度、不同分类维度下“类”“项”“目”“细目”组成问题。
3.1.1教育数据集类目名称的分析
从对教育数据集类目名称两次调查可见,如表2所示,仅仅就“教育”这一类的数据而言,“教育”类数据的内涵究竟是什么?外延究竟是什么?教育和教育科研、教育文化、教育科技它们之间的区别又在哪里?调查平台的“教育科技”“教育文化”等类目下,也没有进一步划分“教育”“文化”“科技”等。《政务信息系统整合共享实施方案的通知》提出:“建立物理分散、逻辑集中、资源共享、政企互联的政务信息资源大数据,构建深度应用、上下联动、纵横协管的协同治理大系统”[20]。我国要建立“逻辑集中”的政务信息资源大数据。《政务信息资源目录编制指南(试行)》提出:“主题信息资源目录是围绕经济社会发展的同一主题领域,由多部门共建项目形成的政务信息资源目录”[21]。我国要建立“主题信息资源目录”。贵州省的《政府数据分类分级指南》附表是贵州省政府数据按主题分类表,“科技、教育”是第14个大类。由此可见,开放政府数据平台数据资源主题类别的确定仅仅有以上文件的指导还是不够的,还需要在建设中明确政府数据分类分级中对于政府数据资源分类如果按主题来划分,主题类别究竟划分多少个类目,具体包含哪些类目才是合理的、科学的。 3.1.2数据集分类方式及教育数据集所从属的分类方式的分析
从对数据集分类方式及教育数据集所从属的分类方式两次调查可见,如表3所示,调查的平台在数据集分类方式上,主要提供的分类方式是按照主题、按照提供机构等,贵阳市新增了行业和服务两种分类方式,东莞分类方式直接发生变化,原来的分类方式是:部门、主题、法人、自然人和地理,之后的分类方式是:重点领域、部门、场景(企业)和场景(人)。由此可见,东莞市第一次调查时显示的分类方式与《政务信息资源目录编制指南(试行)》对政务信息资源目录的分类也有一定相似之处。《政务信息资源目录编制指南(试行)》提出:政务信息资源目录按资源属性分为基础信息资源目录、主题信息资源目录、部门信息资源目录3种类型。上海市试行的《上海市公共数据开放分级分类指南(试行)》对公共数据的开放级别按照公共数据描述的对象,从个人、组织、客体这3个维度分别展开,并对3个维度下具体的开放级别、数据特征、数据示例、开放类型给出了详细的列表[22]。
实际上,无论教育数据集从属于哪种分类方式,无论数据资源采用了什么分类方式,其目的是为了政府更好地管理数据资源,保障数据安全,促进用户更好地利用数据资源。数据资源的管理需要“逻辑集中”,需要有效揭示,所以政府数据开放分类分级中的分类方式需要有一定的标准和依据,需要很好地对接政府数据分级,体现科学性、逻辑性、有效性,既有相对的稳定性又有随着实际需要的变化性。
3.1.3教育数据集主题分布的分析
从教育数据集主题分布两次调查可见,如表3所示,各个平台教育数据集主题分布极其广泛,不仅有教育管理基础数据、教育行政管理数据、普通中小学校管理数据、教育统计数据,还有各类科学技术公司、实验室、科研项目以及相关政策文件的信息等。平台提供的教育类数据资源具体主题有的真正涉及到教育相关的内容,但是也有许多与教育主题关系不大,如“2015年4季度建筑材料质量抽查不合格产品名单”等与教育主题不符。虽然《政务信息资源目录编制指南(试行)》明确了政务信息资源代码结构规则,提出政务信息资源代码结构由前段码、后段码组成。前段码由“类”“项”“目”“细目”组成[21]。然而,调查的平台不仅没有很明确开放政府数据平台数据资源的“类”,而且没有理清楚类下面的“项”“目”“细目”具体组成是什么,所以平台教育数据集主题广泛,内容非常庞杂。虽然《促进大数据发展行动纲要》提出:“完善教育管理公共服务平台,推动教育基础数据的伴随式收集和全国互通共享……推动形成覆盖全国、协同服务、全网互通的教育资源云服务体系”[23],但是这一问题造成实现教育基础数据全国互通共享存在一定困难。
3.2平台数据分类与政策文件数据分类分级的统一性及衔接性问题
实际上,目前各个政策文件数据分类分级在规范性方面也不统一。中央文件《关于构建更加完善的要素市场化配置体制机制的意见》指出:“要推动完善适用于大数据环境下的数据分类分级安全保护制度”。地方性文件主要有上海市的《上海市公共数据开放分级分类指南(试行)》,贵州省的《政府数据分类分级指南》,内蒙古的《政务数据资源分级分类指南》。3个地方性文件都在开篇指出制定指南的目的是保障政府机构开放和共享政府数据;贵州省定义了“政府数据分类”“政府数据分级”的概念,内蒙古定义了“政务数据分类”“政务数据分级”的概念,上海市定义了“公共数据开放分级”“公共数据开放分类”的概念;贵州省和内蒙古都在定义中明确了首先对政府数据分类,在此基础上进行分级。贵州省的分类方式是主题、行业和服务3个维度,政府数据的分级由数据的敏感程度划分,可分为:非敏感数据、涉及用户隐私数据、涉及国家秘密数据,3类数据采取的管控要求不同,对应分为:公开数据、内部数据、涉密数据,相应采用不同共享要求。内蒙古的分类方式是基础数据资源类、主题数据资源类及部门数据资源类3个维度[24],其政府数据的分级、管控要求、不同共享要求基本上与贵州省类似。上海市的公共数据开放分级是依据公共数据安全要求、个人信息保护要求和应用要求等因素,将公共数据分为不同级别的管理方式。公共数据开放分类是将公共数据分为无条件开放、有条件开放、非开放3种开放类别的管理方式。分级分类规则中公共数据的开放级别按照公共数据描述的对象,从3个维度分别展开:个人、组织、客体[22]。
通过分析可见,目前我国已明确为了保障开放政府数据过程中的数据安全及数据流动,解决政府数据开放分类分级问题是非常重要的,但是政府数据分类、政府数据分级概念还不太明晰,两者之间的关系也没有完全确定。实际上,上海市的公共数据开放分类方法,在贵州、内蒙古两地,将其作为政府数据分级。各地区对于数据分类概念、具体维度也不统一。
所调查平台的分类方式基本上与贵州、内蒙古的文件中的分类方式一致,东莞市分类方式与上海市的文件中的分类方式有一致性。那么,如何通过多种分类方式揭示数据资源以及政府数据开放分类分级中的分类方式,如何衔接开放政府数据平台中的政府数据分类方式,这都需要进一步思考。
3.3教育数据集分级及用户授权许可协议存在的问题
調查的平台所提供的数据资源,对所有用户(贵阳市要求用户注册)都是“可共享”,不是“受限共享”,也不是“非共享”。平台没有展现出数据分级,也没有限定各等级的数据的开放共享程度,没有区分出一些数据是可以完全共享的数据,一些数据是可以适当共享,一些数据是只对确需获取该级数据的授权机构及相关人员开放,一些数据原则上不共享。《意见》提出“建立统一规范的数据管理制度”“制定数据隐私保护制度和安全审查制度”“推动完善……数据分类分级安全保护制度”[25]。目前,开放政府数据平台数据资源缺乏安全风险评估,授予用户的权利不明确不充分,不同类型数据的授权许可也是缺失的。
3.4政府机构参与政府数据开放分类分级存在的问题 从各类数据集及教育数据集数量两次调查可见,如表4所示,在2018—2020年间,我国开放政府数据平台数据集总量和教育数据集数量总体上呈现上升的趋势。调查的6个平台在各类数据集总量方面都有所增加,而2个平台有所下降,调查的5个平台在教育数据集数量方面有所增加,而2个平台有所下降(其中一个平台变化情况不明)。教育数据集数量占所有数据集数量的比例并不高。
从教育数据集提供机构分布两次调查可见,如表5所示,各平台的教育数据资源参与机构也是各不相同,差异非常大。调查的各平台都有教育厅、教育局或教育委员会的参与,但是有些平台教育局或教育厅不是教育数据资源提供的主要机构,如广东省、贵州省。两年间平台教育数据集提供机构之间协同有所改进,但还有不足,调查的4个省级平台显示:相较于第一次调查,从只有广东省这1个平台到有3个平台(除北京市)显示与其所辖区有协作,其中,广东省的平台与东莞市的平台在教育数据集建设中从之间无关系变为东莞市向省级平台提供了3个教育数据集。调查的4个副省级和地级市的平台显示:相较于第一次调查,青岛市的平台中,区级机构提供教育数据资源方面从无到有,武汉市、贵阳市的平台中,有更多的区级机构参与了协作,但是所辖区及机构提供的数据集数量有限。2017年5月,国务院办公厅印发的《政务信息系统整合共享实施方案》提出:围绕落实国家政务信息化工程相关规划,建设“大平台、大数据、大系统”,形成覆盖全国、统筹利用、统一接入的数据共享大平台……构建深度应用、上下联动、纵横协管的协同治理大系统[23],由此可见,如何建设“大平台、大数据、大系统”,如何实现“上下联动、纵横协管的协同治理大系统”,如何在开放政府数据平台数据分类分级中实现政府机构协同参与,实现协同治理大系统这一问题还有待解决。
4我国政府数据开放分类分级发展策略
4.1加强我国政府数据开放分类分级的顶层设计
虽然我国中央政府层面的文件《关于构建更加完善的要素市场化配置体制机制的意见》,贵州省的《政府数据分类分级指南》,上海市的《上海市公共数据开放分级分类指南(试行)》等地方性文件明确了政府数据开放分类分级,以及目前已发布的《政务信息资源目录体系》《政务信息资源交换体系》等政策文件也涉及政府数据开放分类分级相关的内容,但是政策文件中关于政府数据开放分类分级的概念不明确,虽然在分级中都考虑到政府数据对国家安全、社会稳定和公民安全的重要程度,以及数据是否涉及国家秘密、是否涉及用户隐私等敏感信息,但是实践中政府数据开放分类分级的方法有很大相同。
各开放政府数据平台所采用的分类方式各不相同。一个开放政府数据平台的数据分类往往可能与另外一个平台的数据分类差别很大。因为平台上没有对可完全开放数据和可以附加一定条件开放的数据进行分级显示,所以在数据分级方面基本没有差别。我国当前130个地方政府数据开放平台系统各异、各数据集异构分散、有可能造成开放的政府数据价值的流失、数据流通安全方面的隐患等,不利于用户的利用,也很难使政府数据成为市场有效流动、交换共享的要素。我国当前政府数据开放分类分级管理标准化科学化管理缺乏全局性。当务之急是从宏观层面对我国政府数据开放分类分级管理进行统一规划建设,这就需要“顶层设计”这样的方法。
我国政府数据开放分类分级的顶层设计就是从全局视角出发,从国家层面出发,围绕着未来构建国家一體的开放政府数据大平台,在保障数据安全的前提下,充分发挥数据生产要素价值的核心目标,对政府数据开放分类分级框架进行统筹规划,确定各组成部分和各要素,涵盖政府数据开放分类分级标准指南的确立、对行政系统实施管理、自上而下地解决政府数据开放分类分级的各种问题,进而形成一个完整的标准化的科学的体系,推动我国政府数据开放分类分级的进程。各开放政府数据平台“自下而上”地开展政府数据开放分类分级的路径虽然有助于自身平台数据资源分类安全工作,但是不足以支撑国家“大平台、大数据、大系统”的建设,不足以支撑国家安全观视阈下的数据安全管理[26],所以,国家对政府数据开放分类分级管理,需要通过“自上而下”的方式。
4.2分类分级一体化思想下政府数据开放分类标准的制定
政府数据资源庞大,政府数据类型众多,可将其按不同的方式进行分类。从不同分类角度审视政府数据,则不同分类下的政府数据的数量、范围、类型、结构及所包含的内容就各不相同。《促进大数据发展行动纲要》明确提出:“优先推动信用、交通、医疗……文化、教育、科技、资源、农业……等民生保障服务相关领域的政府数据集向社会开放”[21],开放政府数据平台建设中究竟以“教育”为一类,还是以“教育科技”或“教育文化”等为一类呢?此外,教育数据可再细分,可以分为基础数据、状态数据、资源数据和行为数据,也可以分为学生数据、课程数据、用户生成的数据、政府数据与机构数据,还可以分为个体数据、课程数据、学校数据、区域数据、国家数据等。由此可见,明确政府数据资源的分类体系,各类的内涵,确定不同“类”下面的“项”“目”“细目”是迫切需要解决的问题,明确哪些基础数据不涉及敏感信息可以开放,哪些涉及敏感信息不能开放等问题也需要解决。
开放政府数据平台分类标准的缺失造成了各地开放政府数据平台分类方式、类目名称、数据资源主题分布等的主观随意性,影响了公众对开放政府数据资源的利用,影响了数据的分级,影响了“形成覆盖全国、统筹利用、统一接入的数据共享大平台”的建设进程,影响了我国政府数据开放的整体水平。
虽然,我国《政务信息资源目录编制指南(试行)》提出:政务信息资源目录分类包括资源属性分类、涉密属性分类、共享属性分类和层级属性分类[21],且以资源属性为角度,对政务信息资源目录划分为基础信息资源目录、主题信息资源目录、部门信息资源目录。那么,有多少政府数据资源?政府数据资源如何分布?政府数据资源可以有哪些分类方式?不同分类方式下究竟包含哪些数据呢?什么是敏感的政府数据,敏感的政府数据在哪里?政府部门可以提供哪些数据资源?因为不同的分类方式取决于要开放和保护的数据的价值和内容,不同的分类方式形成了不同类别的数据,而对于不同类别的数据,保护的主体、方式和程度也是不一样的。同一数据在不同场景中也会被纳入不同的分类。基于政府数据保护与利用平衡视角下的政府数据开放分类需要以分类分级一体化思想为指导,进而制定出政府数据开放分类分级中的“我国开放政府数据平台数据资源分类标准”,可发布《我国政府数据资源分类法》图书或指南,与政府数据开放分级相配合,与描述开放数据集和数据资源的核心元数据标准相配合,应用于指导我国政府数据开放分类分级中数据资源的分类组织工作。 4.3分类分级一体化思想下政府数据开放分级标准及用户授权许可协议的制定
虽然《政务信息资源目录编制指南(试行)》提出:“政务信息资源目录按共享类型分为无条件共享、有条件共享、不予共享3种类型”,其依据是“可提供给所有政务部门共享使用”或者“可提供给相关政务部门共享使用或仅能够部分提供给所有政务部门共享使用”或者“不宜提供给其他政务部门共享使用”[21],其依据也就是数据共享的对象或是所有政务部门,或是相关政务部门,或是无其他政务部门。上海市的《上海市公共数据开放分级分类指南(试行)》提出了数据集在个人、组织、客体3个维度下的不同开放级别和不同开放类别。贵州省的《政府数据分类分级指南》提出,依数据的敏感程度将政府数据分级为:公共数据、内部数据、涉密数据。不同数据等级数据对于开放和共享提出的要求也不同。
政府数据开放共享的对象有政务部门、公众、企业。我国没有国家层面政府数据开放分类分级中分级的具体标准以及开放政府数据平台数据资源用户授权许可协议,没有对政府数据安全分级详细规定,没有对政府非涉密但敏感数据的规定,所调查的开放政府数据平台其提供的数据资源没有任何按共享类型的划分,所提供的资源用户都可以免费使用(贵阳的平台需注册)。开放共享的政府数据安全关乎国家安全、社会稳定、公众和个人安全,与我国公民权益息息相关。此外,一些政府机构不愿意开放政府数据资源,其中一个原因就是担心开放数据不当而引发数据侵权、数据滥用等风险事件,由此可见,平衡政府数据的开放与安全保护是非常重要的,制定政府数据开放分级标准及用户授权许可协议是现实需要。政府在制定数据资产分类分级清单过程中,通过开放政府数据的风险评估,依据标准列出数据的访问级别:开放、受限开放、不开放。对于“受限开放”数据,在其字段中须填写如何获得访问的详细信息,对于“不开放”数据,要说明其无法开放的原因,保障政府机构在开放政府数据过程中能确定以适当的策略方式,保护数据的可用性、完整性及保密性[21],依据政府数据开放分级标准开放合规的数据,按要求公布政府数据开放目录,通过在线完全下载或部分下载、离线共享或定制服务等方式向社会开放共享政府数据资源。
4.4健全政府数据开放分类分级管理的组织体系并加强分类分级工作的协同
虽然各地在大数据管理局等负责下推进开放政府数据过程中政府数据资源建设,但是,开放政府数据平台数据分类分级中体现出各个平台之间,各平台其资源建设机构之间,上下级间、同级间缺乏有效的协调,由此使得各平台在数据分类分级中互不相干、各行其是。针对上述问题,在我国政府数据开放分类分级顶层设计方法的指导下,建立健全我国政府数据开放数据资源管理体制,可在国家信息中心下设政府数据开放分类分级管理部门,分类分级管理部门负责确定政府数据开放分类标准、分级标准、制定相关制度和流程,监督各地开放政府数据平台负责机构对政府数据资源分类分级的实施,促进建立协同式的开放政府数据平台数据资源分类分级管理协同机制,协助相关政府部门创建政府数据清单,进行开放政府数据风险识别与风险评估、确定开放政府数据平臺数据访问级别。政府数据开放分类分级管理围绕公众需求和公众服务,支持政府部门和公众围绕开放政府数据平台建立双向互动交流模式,保护政府数据在开放共享中的安全,对内让数据要素充分流动,同时对外保障开放共享的政府数据资源不危及国家安全与公共利益。
参考文献
[1]中共中央国务院.关于构建更加完善的要素市场化配置体制机制的意见[EB/OL].http://www.xinhuanet.com//mrdx/2020-04/10/c_138964 212.htm,2020-04-12.
[2]郑磊,高丰.中国开放政府数据平台研究:框架、现状与建议[J].电子政务,2015,(7):8-16.
[3]吴钢,曾丽莹.国内外政府开放数据平台建设比较研究[J].情报资料工作,2016,(6):75-79.
[4]陈美.面向增值利用的政府开放数据平台顶层设计研究[J].图书馆,2019,(8):23-28.
[5]段尧清,邱雪婷,何思奇.主题与区域视角下我国城市政府开放数据利用现状分析[J].图书情报工作,2018,62(20):65-76.
[6]新华网.“2020中国开放数林指数”在线发布[EB/OL].http://sh.xinhuanet.com/2020-07/22/c_139232360.htm,2020-07-31.
[7]中共中央国务院.国务院关于印发促进大数据发展行动纲要的通知[EB/OL].http://news.163.com/15/0906/09/B2QO1JKJ 00014SEH.html,2020-05-06.
[8]人民网.中国软件评测中心发布2015政府网站绩效评估结果[EB/OL].http://politics.people.com.cn/n/2015/1210/c1001-279085 67.html,2020-07-31.
[9]东方网.复旦发布国内首个地方政府数据开放指数 上海开放程度全国第一[EB/OL].http://shzw.eastday.com/shzw/G/20170605/u1ai10626299.html,2020-07-31.
[10]北京市政务数据资源网[EB/OL].https://data.beijing.gov.cn/,2020-08-02.
[11]上海市公共数据开放平台[EB/OL].https://data.sh.gov.cn/,2020-08-02.
[12]开放广东[EB/OL].http://gddata.gd.gov.cn/,2020-08-02.
[13]贵州省政府数据开放平台[EB/OL].http://data.guizhou.gov.cn/#!/,2020-08-02. [14]青岛公共数据开放网[EB/OL].http://data.qingdao.gov.cn/,2020-08-02.
[15]武汉市公共数据开放平台[EB/OL].http://www.wuhandata.gov.cn/whData/index.html,2020-08-02.
[16]数据东莞[EB/OL].http://dataopen.dg.gov.cn/dataopen/,2020-08-02.
[17]贵阳市政府数据开放平台[EB/OL].https://data.guiyang.gov.cn/city/index.htm,2020-08-02.
[18]百度文库.政府数据数据分类分级指南(征求意见稿)[EB/OL].https://wenku.baidu.com/view/b754c9bd9fc3d5bbfd 0a79563c1ec5da50e2d69d.html,2020-08-03.
[19]赵润娣.大数据时代政府数据开放与共享研究——基于开放政府数据平台中教育数据开放与共享现状的调查[A].鲍静.大数据与公共服务[C].2020.
[20]中共中央国务院.国务院办公厅关于印发政务信息系统整合共享实施方案的通知(国办发〔2017〕39号)[EB/OL].http://www.gov.cn/zhengce/content/2017-05/18/content_51949 71.htm?gs_ws=tsina_636308006794141816,2020-04-16.
[21]国家发展改革委中央网信办.关于印发《政务信息资源目录编制指南(试行)》的通知[EB/OL].http://www.gov.cn/xinwen/2017-07/13/content_5210203.htm,2020-05-10.
[22]道客巴巴.上海市公共数据开放分级分类指南(试行)[EB/OL].https://www.doc88.com/p-6651645226630.html,2020-08-03.
[23]中共中央国务院.国务院关于印发促进大数据发展行动纲要的通知[EB/OL].http://news.163.com/15/0906/09/B2QO1 JKJ00014SEH.html,2020-05-06.
[24]道客巴巴.政務数据资源分级分类指南[EB/OL].https://www.doc88.com/p-9942943598081.html,2020-08-03.
[25]中共中央国务院.关于构建更加完善的要素市场化配置体制机制的意见[EB/OL].http://www.xinhuanet.com//mrdx/2020-04/10/c_1389642 12.htm,2020-04-12.
[26]对《数据安全法》的理解和认识|数据分级分类[EB/OL].https://mp.weixin.qq.com/s?src=11