论文部分内容阅读
收稿日期:2020-10-12
基金项目:国家社会科学基金重大项目“数字政府建设的安全治理体系研究”(项目编号:20ZDA038);国家自然科学重点项目“非传统安全问题风险识别与防范机制——以智慧城市治理中的信息共享与使用为例”(项目编号:71734002)。
作者简介:张聪丛(1991-),女,博士研究生,研究方向:数字政府治理。陈涛(1980-),男,教授,博士生导师,研究方向:智慧城市、电子政务。
通讯作者:黄艳(1975-),女,教授,硕士生导师,研究方向:公共政策评估、非传统安全。
摘要:[目的/意义]开放数据生态系统中利益相关者之间的互动对于实现开放数据计划的成功和可持续发展至关重要。[方法/过程]本研究以中国开放数据实践中关键组织的网站链接网络为研究对象,使用Webometric Analyst 4.1和UCINET进行社会网络分析,了解中国开放数据生态系统中各个利益相关实体的互动交流现状,分析其网络互动模式,评估国家在开放和利用数据方面的准备情况,为开放数据实践行为提供建议和参考。[结果/结论]中国的开放数据计划总体上是以政府组织主导的方式向前发展。在不同类型的组织沟通交流中,企业组织与政府组织的互动最为密切;在同一类型内部,非政府组织网络内部联系更为紧密;教育科研机构在开放数据网络中的参与互动还需更加积极。尽管部分地方政府在数据开放创新方面做出尝试,地方政府机构之间的协作互动网络依然相对稀疏。各利益相关者需扩大互动的深度和广度,主动积极构建开放数据生态系统,促进互动合作网络的优化,顺应世界数字化发展潮流,实现更好的数字化治理。
关键词:开放数据;生态系统;互动;利益相关者;网络计量学;中国
DOI:10.3969/j.issn.1008-0821.2021.04.011
〔中图分类号〕D035-39〔文献标识码〕A〔文章编号〕1008-0821(2021)04-0101-18
Mapping the Interactions Among Stakeholders in the Open Data Ecosystem
——A webometric Network Analysis from China
Zhang Congcong1Chen Tao1Huang Yan2*
(1.College of Public Administration,Huazhong University of Science and Technology,Wuhan 430074,China;
2.Law and Business School,Wuhan Institute of Technology,Wuhan 430074,China)
Abstract:[Purpose/Significance]Interactions among stakeholders in the open data ecosystem are dominant to achieve success and sustainable development of open data initiative.[Method/Process]This study focused on the hyperlink networks extracted from the websites of critical organizations engaged in open data to explore the interactions of the entities through the inter-linkage analysis and co-mention analysis by using Webometric Analyst 4.1 and UCINET.[Result/Conclusion]Findings showed that the Open Data Initiative was generally moving forward in a government-led manner.Enterprise organizations interacted with government organizations most closely among different types of organizations.While within the same category,the NGO network was more closely interconnected.In addition,the network between local governments in China was relatively sparse because their explorations of open data were at different stages.More efforts were needed to promote the optimization of cooperative networks.
Key words:open data;ecosystem;interactions;stakeholders;webometrics;China
隨着开放数据在世界范围内蓬勃发展,越来越多的发展中国家积极参与其中。在追踪不同国家开放政府数据生态系统时发现,不同的社会制度背景会影响开放数据实践持续推进和制度化的可能性[1],研究发展中国家的数据开放问题将会为整个开放数据的知识基础贡献诸多经验。2013年,世界银行联合开放数据研究所和开放知识基金会共同提出了发展中国家开放数据项目(ODDC),旨在讨论发展中国家的数据生态系统、权力下放、新兴影响以及各部门之间的联系,以根据发展中国家的本土情况促进开放数据的实施,帮助发展中国家的决策者和公民理解并受益于开放数据[2]。考虑到开放数据在机构合作、公众参与、创新增长方面的潜能,发展中国家开始在国家层面发布开放政府数据行动计划,通过信息公开或数据开放回应公众需求[3]。 越来越多的组织意识到开放数据使用可能带来的发展潜力,更多实体参与到开放数据生态系统中来,期望分享数据红利。在基本满足更多数据尽可能对更多人开放的数据共享需求之后,如何实现数据在各个利益相关者之间流通使用成为开放数据生态系统可持续性发展的关键。开放数据生态系统主张以系统的、互动的、嵌入的观点探究各要素之间的关系,综合考虑对干预措施、社区反馈、技术可用性的认识,关注各个实体的互动协作网络[4]。其中,政府机构、企业组织、数据中介、研究人员、记者等群体都是整个开放数据生态系统的基本要素[5-7],承担数据生产、处理、使用和创新的各项功能。这些机构之间的互动协作是推动政府数据开放成功的重要决定因素[8-9]。
但是,在具体的开放数据实践中,大多数发展中国家缺乏多层次合作框架支持开放数据创新使用,很难保持开放数据的可持续性[10-11]。各类组织之间缺乏合作意识,导致各个利益相关者不能及时互动,从而降低数据使用效率,增加数据安全风险[3,8,12]。加之,已有开放数据的研究虽然承认利益相关者之间互动协作对价值创造的重要性[12],却鲜有研究对发展中国家开放数据生态系统中的利益相关者的互动协作情况进行直观化的实证说明。为了弥补这个研究差距,本文主要关注中国开放数据生态系统中各个利益相关实体的互动交流,尝试借助分析工具可视化其互动模式,分析各利益相关者之间的合作行为特点,评估国家在开放和利用数据方面的准备情况,促进相关研究公共知识库的发展,为开放数据实践行为提供建议和参考。此外,不同社会制度背景也会影响开放数据推进情况,中国的开放数据实践落地实施往往都在地方政府层面,地方政府官方平台之间的互动也是十分重要的。
因此,对中国开放数据生态系统中利益相关者之间互动关系的研究可以分为两个问题,一是中国开放数据实践中各个参与组织的互动现状与模式;二是地方政府官方平台在开放数据实践中的互动情况。在具体研究中,借鉴已有基于网络计量视角对多组织协作模式的研究[13-15],采用网络计量学方法,选取中国开放数据项目中的关键组织,如政府组织、非政府组织、教育研究机构以及企业组织(包括技术公司、基礎设施供应商、运营商等)为研究对象,分析其网络链接行为网络结构特征,了解和评估多类型组织的互动协作模式。
1背景与文献综述
1.1开放数据生态系统
在关于信息通信技术如何推动政府管理变革的研究中,生态系统的概念已受到一定程度的关注,这些在有关开放政府或开放数据的讨论中都有体现[16-17]。Harrison T M等[18]回顾了开放政府的文献后,建议从生态系统的角度研究开放政府的概念,有目的地构建开放政府生态系统,关注政府与用户和组织的互动。在整合相关研究的基础上,Dawes S S等[9]提出了一个由利益相关者、政策、实践、关系和影响组成的开放政府数据生态系统模型,随后研究者也对该框架进行了进一步完善和验证[19-20]。开放数据生态系统与数据生态系统[21],链接数据生态系统[22]和开放政府生态系统[18]等概念类似,其核心主张是从系统互动和嵌入式的角度探讨各种元素之间的关系[23]。在生态系统内,许多参与者相互交流以生成和使用数据,为创建、管理和维持数据共享计划提供环境[21]。同样,评估开放数据生态系统成功与否的最重要指标之一就是利益相关者是否充分互动和有效参与[23]。
作为开放数据生态系统的基本要素,利益相关者及其行为一直是值得关注的。采用Freeman R E[24]对利益相关者的定义,开放数据计划的利益相关者既可以是政府内部的(例如,负责制定和实施政策的政府组织),也可以是政府外部的(例如,受政府行为或规则影响的行业、社区或个人)[25]。这些利益相关者群体通常在参与推动开放数据计划发展、数据开放使用和深度开发中扮演着多种角色。为了保障开放数据生态系统的可持续性,数据供需方以及利益相关者之间存在大量的联系和依赖。开放数据计划逐渐积累了一些基于生态系统理论的最佳实践的经验[26]。来自英国的实践经验将利益相关者分为数据生产者、中间商和数据使用者[17]。Dawes S S等增加了政策制定者来表达政治维度因素对可开放数据计划可持续的重要影响[9]。随着数据成为许多产品和服务的基础,利益相关者可以使用数据,深度开发数据产品,参与数据市场,通过这些生态系统中的关键行动者的交互作用继续创造价值[27]。政府共享开放数据后,私营企业的管理者或开发者可以选择实际相关的数据作为提供免费信息的资源,从开放数据中寻找新的商业模式来刺激可持续的价值产生[28]。非政府组织或技术人员通过参与黑客马拉松的开放数据竞赛,使用数据创建应用程序,促进社会透明或提供公民服务,增进地方政府与公民互动[29]。政府组织则可以在这些互动中获得关于市政开放数据集的有价值的反馈,从而及时回应、告知和发展未来开放数据的版本。
1.2网络计量学相关研究
21世纪互联网成为通信和信息传播的重要媒介,海量规模的信息资源在网络上被公开表达访问。正是在这样的背景下,网络计量学开始出现。网络计量学最初被用于万维网的一般信息学分析[30],如评价和预测引文影响力等,具有鲜明的引文分析的特点[31]。随着社会网络分析范式的广泛应用,“链接”关系的推广和泛化[32],网络计量学与社会网络分析逐渐结合,用于研究与特定网站集合之间的链接,通过测量超链接网络的不同定量指标,分析整体的网络结构与关键节点特征,判断网络信息流动方向、节点的绩效表现和影响力[13,33-36]。具体而言,基于Web的网络分析开始在人文社会科学调查中越来越多地出现[37],被广泛用于了解和评估多类型组织的协作模式[15]。通过评估超链接网络的节点中心性指数等指标,揭示行动者之间的交流模式[38],洞察组织间关系[13],确定不同行动者在创新扩散过程中的角色[36]。
然而,由于搜索引擎中用于自动和手动收集超链接计数的工具已经在2012年被关闭等技术原因,基于超链接分析的网络计量分析遭遇困境[39]。研究者积极探索寻找替代性的数据源来取代传统的基于超链接的网络分析方法,研究发现基于标题和基于URL提及分析与超链接分析的指标存在高度相关性,认为基于URL或标题提及的测量指标是在二进制网络和加权网络中替换超链接的最佳选择[40-41]。Thelwall M等[42]综合考虑数据负担能力、软件编程和成本等条件,提出使用Bing Search API 2.0是从搜索引擎API收集用于Web计量分析原始数据的最佳选择。在此之后,网络计量分析继续不断向不同学科发展。因此,本研究使用Bing Search API 2.0收集万维网上中国开放数据计划中利益相关者网站的URL计量原始数据,借助Webometric Analyst 4.1对其链接引用网络进行分析。 1.3中国的开放数据
在过去10年中,开放数据的讨论主要是在西方发达国家的背景下展开的。作为世界上重要的发展中国家,中国也在努力促进信息公开和数据开放,释放数据活力,以顺应世界潮流,提高政府透明度,提升公共服务能力,从而实现更好的治理。一方面,中国在信息公开方面不断地制度化成果,为开放数据实践提供了制度支撑与发展方向。2008年,中华人民共和国国务院颁布施行《中华人民共和国政府信息公开条例》,将提高政府透明度,充分发挥政府信息服务于人民生产生活和社会经济活动的作用写入法律。2019年修订后的《中华人民共和国政府信息公开条例》强调,行政机关公开政府信息应坚持以公开为常态、不公开为例外[43]。国务院2015年发布《促进大数据发展行动纲要》将开放数据正式列为全国十大重点项目之一,肯定了其在推动转型和增强竞争力方面的重要意义[44]。中国政府一直致力于推进互联网基础设施的建设和使用,拥有开展数据开放的巨大优势。中国互联网络信息中心发布的第46次《中国互联网络发展状况统计报告》表明,截至2020年6月,全国网民规模达9.40亿,互联网普及率达67.0%,是2009年的28.9%的两倍多[45]。
另一方面,相关的学术研究成果也在逐步增加,中国公共部门的开放创新正逐渐引起人们对数字政府背景下政府透明度、开放数据创新、跨部门数据共享、政府开放数据能力、数字驱动的公众参与等问题的关注[46-50]。研究者对中国开放城市地理数据的案例研究表明,随着数据存储和高性能计算的发展,数据众包平台计划极大促进共享和互操作性[51]。针对快速变化环境中的相关技术和公民的要求,Wang C等[52]从4个IT相关项目中政府和非政府组织之间的合作出发,根据合作过程中的决策的权力和责任的分配应对,提出了3种适应性治理类型。在开放数据实践过程中,研究人员特别考虑了开放政府(透明度)和隐私保护之间存在的争议和动态关系[53]。此外,还有一些开放数据应用的案例研究,分析城市大数据对更多与可持续发展目标相关的创新目标和指标的积极影响[54]。在由万维网基金会(The World Wide Web Foundation)、开放数据研究所(Open Data Institute)联合开发的开放数据晴雨表(Open Data Barometer)第4版全球评估报告中,中国在2016年被调查的115个国家和地区中排名第71位[55]。总体看来,政府数据开放准备度尚可,尤其是地方政府行动表现突出,但执行度和影响力还比较落后,数据集的开放程度不高,政府数据开放对政治、社会、经济的影响不足[56]。
2数据和方法
2.1数据收集
网络计量的一些研究已经证实了使用搜索引擎和社交媒体工具获取原始数据的可行性和可靠性[57-59]。为了回应文章的两个研究问题,本文的数据收集也是分为两个部分。针对第一个研究问题,也就是探究中国开放数据实践中各个参与组织的互动现状与模式,本文参考国际研究者使用谷歌和Twitter搜索用于选择种子站点的方法,使用更符合中国情境的百度和微博来选择种子站点,数据搜索时间截止2019年1月31日。首先,参考Acharya S等[59]对尼泊尔开放数据网络模式研究一文中的搜索策略和组织分类标准,选择关键字“开放数据(Open Data)”“开放中国(Open China)”和“开放政府(Open Government)”在百度上进行中英文搜索。类似地,使用标签#开放数据(Open Data)和#开放中国(Open China)和#开放政府(Open Government)在微博上进行中英文搜索。然后,访问和阅读各自主页的结果,判断选择与开放数据项目相关的组织机构,追踪并手动访问他们的网站,以确定他们在中国开放数据项目中的角色和重要性[5]。这里文章主要基于组织的官方描述将组织类型划分为政府组织(简称GO)、企业组织(简称EO)、教育研究机构(简称ERI)和非政府组织(简称NGO),并将NGO进一步区别是否为国际组织(简称IO)。最后,列出种子网站的详细信息和特征,包括它们的名称、组织类型、在中国开放数据中扮演的角色以及它们的网站地址或URL等,结果如表1所示。
针对第二个研究问题,为了更好地了解中国地方政府官方平台在开放数据实践中的互动情况,文章对地方政府官方数据开放平台的网站进行分析。“中国开放数林”指数由复旦大学数字与移动治理实验室出品,是国内第一个专门针对地方政府数据开放的系列评估报告。本文根据复旦大学数字与移动治理实验室发布的《中国地方政府数据开放报告(2018下半年)》确定种子站点[60],同时列出了地方政府、平台名称、简称、建立日期、地区、行政级别和URL,结果如表2所示。
2.2数据分析
首先,在选定了种子网站之后,使用Bing API运行高级布尔搜索,根据URL引用计算与站点链接的相关外部网站,以获得与基本查询匹配的外部网站列表,数据搜索日期为2019年1月31日。其次,使用Webometric Analyst 4.1(http://lexiurl.wlv.ac.uk)对数据进行分析,Webometric Analyst是一个基于Windows的免费程序,用于Altmetrics、引文分析、社交网络分析和网络计量学分析[58]。本研究主要选择互提及网络分析(Inter-mentioned Network Analysis)和共提及网络分析(Co-mention Network Analysis),关注各利益相关机构之间在网络中的结构关系与利益相关者在网络交流中的相似状况。其中,互提及网络示意图说明了站点集合之间的互连性模式,能够表示两个组织之间建立的最强烈的联系,所以用于刻画机构之间在网络上的结构关系。共提及网络分析基于引用一对目标站点的外部站点数来确定,这些共同之处显示出一些不直接相关但同等重要的节点,可以揭示利益相關者的网络交流状况。此外,利用UCINET测度整体网络层面的密度、参与者与连接关系,节点层面的中心性指标,尝试将不同的利益相关者的复杂关系网络可视化[61],以便更好理解和评估多种类型组织中的协作模式[15]。 3结果
3.1基本情况描述
开放数据实践十分依赖于其所在的背景环境,并且往往会受到基本管理框架的影响[7]。与现有的分散生态系统、集中生态系统和跨境开放数据生态系统等开放数据模型不同,中国的开放数据实践呈现出更为复杂的局面。非政府组织、企业组织、政府组织和教育研究机构通过合作,积极推进开放数据项目的准备与实施。例如,2013年2月中国加入开放知识网络,2014年初与数据新闻、城市规划、环境保护、数据科学等多个社区共同发起“开放数据中国”活动,以构建和培育开放数据生态系统为社区使命[62]。2014年1月22日,开放知识基金会的中国地方机构举办了首届“北京开放数据日”开放数据黑客马拉松活动[63]。2015年,由中国工业设计研究院、开放数据中国、上海交通大学、复旦大学和上海市政府共同发起的上海开放数据应用创新大赛(Shanghai Open Data Apps,SODA)正式启动[64]。到目前为止,SODA大赛已经成功举办了四届,在城市交通、城市安全、食品安全、产业发展和城市生活等诸多方面实现了从数据到价值创造的转化。大赛高度重视国际合作与交流,多次与英国、美国、瑞士等国开展深入交流与合作。
此外,在2015年之前,中国的一些地方政府已经开始进行开放政府数据的试点试验,这些试验过程也为国家层面的政策制定提供了强有力的纠偏机制[65]。在2012年,上海市政府推出了全国第一个公开数据门户,上海市政府数据服务网(datashanghai.gov.cn),正式提供一站式政府数据资源。首都北京也在同年开通了北京市政务数据资源网(bjdata.gov.cn),自此,区、市、省各级地方政府开始逐渐建立和完善开放数据门户网站。截至2018年10月31日,已有57个地方先后推出了各自的平台,包括8个省(自治区)、2个直辖市、9个副省级城市和38个地级市,具体的时间线分布如图1所示。
注:▲代表省份(自治区);●代表城市。图1地方政府开放数据平台建设时间表
3.2组织间互动交流的模式
首先对按照数据收集步骤得到的表1中的种子站点进行简单描述分析。可以看出,最后选择的与中国开放数据相关的利益相关者有46个,涵盖了11个政府组织、13个企业组织、15个非政府组织以及7个教育研究机构。其中,政府组织主要涉及政策制定、交通气象、知识产权等机构;企业组织里面涉及到了ICT供应商、开发者、技术公司等;非政府组织涉及到了网络社区、国际组织、行业协会等。这些角色基本覆盖了开放数据生态系统中的各个功能环节,在一定程度上体现了开放数据生态系统复杂性。
借助Webometric Analyst 4.1得到中国开放数据关键利益相关者的互提及網络,如图2所示,以及共提及网络,如图3所示。一般用网络密度指标对网络整体结构情况进行判断,通过计算网络密度判断网络对节点的影响程度。网络密度是实际连接关系数量除以成员之间的最大连接数,代表了成员之间的平均连接数和个体成员与其他成员的亲密程度[66]。图2所代表的有向(非对称)互提及网络的密度值为0.1942,图3所代表的无向共提及网络的密度值为0.8213,这表明整体看来共提及网络对其结构中的个体影响较大,相互提及网络节点间相对分散,关系更加集中。为了更加深入细致了解各利益相关者的互动交流行为,接下来将对互提及网络和共提及网络进行科学量化的分析。
3.2.1互提及网络分析
互提及网络是基于一对网站之间的非对称(定向)相互提及数的表示形式,该图指示了站点集合之间的相互连接模式,可以反映机构之间在网络上的结构关系。网络图中的颜色和形状代表不同的组织类型,绿色三角形代表非政府组织(NGOs),红色正方形代表政府组织(GOs),黄色圆圈代表企业组织(EOs),蓝色菱形代表教育研究机构(EIRs),箭头表示URL的方向。直观上看,www.baidu.com、www.github.com、www.oschina.net、www.uestc.edu.cn和www.mof.gov.cn占据了整个网络的中心位置。这几个节点分别属于企业组织、政府组织(国际组织)、非政府组织、教育研究机构和政府组织。这些不同类型的组织之间基于各自的功能性分工又相互紧密联系。在非政府组织中,如www.weibo.com、www.github.com、www.oschina.net等网站与其他节点,尤其是国际非政府组织如www.github.com、www.okfn.org等网站有着密切的联系。www.miit.gov.cn、www.cac.gov.cn、www.stats.gov.cn、www.sic.gov.cn等政府组织与其他类型的组织联系密切,涉及到了整个网络中较为集中的联系。
度中心性(Degree Centrality)是度量每个节点组织在交流网络中重要性的最直接指标。其通过计算一个节点与网络中所有其他节点直接接触的次数,来反映该节点在网络中的重要性和影响力分布,一个节点的节点度越大就意味着这个节点的度中心性越高,该节点在网络中就越重要[67]。具体而言,入度(Indegree Centrality)显示来自网络中节点到节点的传入连接的数量,而出度(Outdegree Centrality)则显示了自节点的外部连接的数量。在整个互动沟通的网络中,与其他行动者联系较多的组织更能够有效地控制和影响处于核心地位的网络。表3分别列出了入度和出度最高的前20个网站。企业组织中百度在两个测量值上都有较高的结果(Indegree Centrality=189 997,Outdegree Centrality=390 316),非政府组织中的国际组织Github也有相对高的数值(Indegree Centrality=189 427,Outdegree Centrality=178 698),这都较为直接地反映出他们在整个网络中的重要性。在前20个节点中,新浪微博、百度、Github、Pivotal中国、开源中国社区和中华人民共和国财政部的入度值排名靠前,也就是说这些节点组织受到了其他节点组织的高度关注,其他节点组织对这些节点组织在网络中的重要程度和声望是比较认同的,因此这些节点更可能引导整个网络交流的视角和内容。在出度排名前20的站点中,有6个政府组织,约占政府组织总数的54.5%;5个企业组织,约占企业组织总数的38.5%;8个非政府组织,约占非政府组织总数的53.3%;1个教育研究机构,约占教育研究机构总数的14.3%。这些节点在整个互动网络中十分努力地与其他节点取得关联,能够从其他成员那里获得很多信息知识。 中介中心性(Between Centrality)是以经过某个节点的最短路径数目来刻画节点重要性的指标,主要衡量网络中的桥接关系。经过一个点的最短路径的数量越多,就说明它的中介中心度越高,对网络中信息流动的影响越大[68]。表4列出了中介中心性最高的前20个网站。www.baidu.com中介中心性最高(740.417),其次是www.github.com,中介中心性值达到504.534。就每种不同类型的组织而言,在所有的教育研究机构中,中介中心性最高的是电子科技大学。中华人民共和国互联网信息办公室在政府组织里面中介中心性值最高(180.571)。这些节点处在与其他点相互之间联系的捷径上,是其他组织之间的桥梁,可以帮助那些没有直接联系到其他组织的参与者取得关键信息和资源,缩小了不同小协作团体之间的信息差距。
3.2.2共提及网络分析
共提及网络分析是基于引用一对目标站点的外部站点数来确定的,可以显示出一些不直接相关但是同等重要的节点,反映不同利益相关者在网络交流中的相似度。网络图中的颜色和形状代表不同的组织类型,绿色三角形代表非政府组织(NGOs),红色正方形代表政府组织(GOs),黄色圆圈代表企业组织(EOs),蓝色菱形代表教育研究机构(EIRs)。由于几乎所有的节点都被共同提及,原始的共提及网络关系十分稠密。为了更加清楚直观地观察各个组织的互动交流模式,因而选择共同提及次数大于400和共同提及次数大于800的共提及网络图,来展示他们之间的关系,如图3和图4所示。
非政府组织中的okfn.org和dca.org.cn、政府机构中的cac.gov.cn、sic.gov.cn和stats.gov.cn是最常被共提及的網站。站点为bigdata-research.org的教育研究机构也在网络中占据了关键位置。例如,okfn.org和www.cybersac.cn共被提及917次;www.bigdata-research.org和www.oschina.net共被提及917次;www.bigdata-research.org和www.cac.gov.cn共被提及889次;www.bigdata-research.org和www.mof.gov.cn共被提及856次。此外,针对每种类型组织内部而言,非政府组织之间经常会被共提及,okfn.org和www.opendatacenter.cn被共提及次数多达1 051次;okfn.org和opensourcecloud.cn的共提及次数达到1 033次;OKFN中国办事处cn.okfn.org和okfn.org共提及更是达到15 573次。
大多数时候,同一群有着相同目的的利益相关者会被一起提及,因为他们分享了一些同等重要的东西。从图3和图4可以看出,外部网站对中国开放政府数据相关提及引用时,一般提到了政府组织,基本上很大程度也会一起提到相关的非政府组织。同时,政府机构与特定的一些企业机构关系也是十分紧密。教育研究机构www.opendatacenter.cn与政府组织、非政府组织、企业组织会经常被共同提及,但是,其他教育研究机构却并不活跃。不同领域的联系也在一定程度表明了多种类型组织在中国开放数据实践上的合作互动。就每种组织类型内部的这些机构而言,大部分的企业组织其实并没有被频繁地共同提及,政府组织内部可能由于不同的侧重,共同提及的也比较少。非政府组织之间的目标或者角色明显会更加集中统一,经常互相支撑而被共同提及。
3.3地方政府官方平台的互动
同样,借助网络计量学对中国地方政府官方平台在开放数据实践中的互动情况进行分析。表2已经列出了地方政府官方数据开放平台的基本情况。《中国地方政府数据开放报告(2018下半年)》评估了57个地方政府平台,其中包含8个省级(自治区)政府平台、2个直辖市、9个副省级城市和38个地级市。图5显示了地方政府官方数据开放平台的互提及网络。整体看来,每一对站点之间的链接很少,网络十分稀疏。贵州省和上海市的平台处于网络的核心位置,与其他节点连接较为紧密。依然可以看到4种类型的连接关系,即第一种是省级政府平台与省级政府平台之间的联系,即广东省(www.gddata.gov.cn)和贵州省(www.gzdata.gov.cn);第二种是具有隶属关系的行政上下级平台之间的联系,即广东省(www.gddata.gov.cn)和惠州市(data.huizhou.gov.cn);第三种是不具有隶属关系的省市之间的联系,如贵州省(www.gzdata.gov.cn)和广州市(www.datagz.gov.cn);第四种则是不同城市之间的联系,如上海市(www.datashanghai.gov.cn)和贵阳市(www.gyopendata.gov.cn)。
为了便于在同一层次上进行深入比较,避免省政府对各省所辖城市的压力,接下来选取49个城市政府官方数据开放平台进行共提及分析,这49个节点几乎都存在共提及关系,为了更加清晰直观地观察,呈现了共提及次数超过250次的网络图,如图6所示。其中,红色圆圈代表省级行政级别的直辖市,黄色圆圈代表副省级城市,蓝色圆圈代表地级市。很明显,共提及图比互提及的密度大,说明外界站点对这些站点一般都是同时提及。在这个网络中,上海、北京和南京3个城市相对比较活跃,也更加容易被外部站点提及。
图7显示了《中国地方政府数据开放报告(2018下半年)》中49个地方政府官方数据开放平台的评估结果。其中,贵阳排名第一,佛山、哈尔滨、上海和广州紧随其后。正如图7所示,积极参与政府开放数据的城市基本上位于中国东部和南部,但表现最好的是位于中国西南部的贵阳。这可能是因为阿里、腾讯等许多知名企业组织在贵阳建立大数据中心,进一步带动了地区整体数字化发展。此外,为了进一步了解哪些因素可能影响地方政府官方数据开放平台开放数据绩效,本研究尝试考虑城市的行政级别、经济发展水平和城市规模3个基本属性与开放数据指数的相关关系。具体操作:城市行政级别分为3级,省级、副省级和地级市;使用地区人均国内生产总值来衡量经济发展水平,数据来自各城市统计年鉴;按照国务院2014年发布的《国务院关于调整城市规模划分标准的通知》,将城市按照城区常住人口划分为超大城市(超过1 000万),特大城市(500万~1 000万),Ⅰ型大城市(300万~500万),Ⅱ型大城市(100万~300万),中等城市(50万~100万),Ⅰ型小城市(20万~50万),Ⅱ型小城市(20万以下),具体数据来源于《中国城市建设统计年鉴》。 表5显示了开放数据指数、行政级别、经济发展水平和城市规模之间的Spearman相关系数。总体而言,城市规模和行政级别与开放数据指数呈显著正相关,经济发展水平影响不显著。可以发现,城市的行政级别与城市政府数据开放绩效在0.01的显著水平下呈正相关,也就是说,行政级别越高,该政府平台数据开放的总体表现越好。这在中国语境下也不难解释,地方政府创新实践或者对于国家政策意愿的执行,一定程度上需要整体政治资源、经济资源和基础设施资源较好的地区,城市行政级别越高,相关的资源支持机会就会越多,有利于这些实践的实施。此外,城市规模越大,其政府数据的积累体量就越大,政府利用信息技术进行社会管理与公共服务的动机就越强,越有利于激励地方政府进行整体的数字化建设。而经济发展水平没有显示出显著的相关性,可能是因为开放政府活动的整体支出其实并不是很大部分,对于地方经济情况要求不高。
4结论与讨论
越来越多的数据被开放使用,给公众和社会各个主体赋予了更多的能力和权力。依托信息技术发展,推进多主体协作互动,充分发挥公众智慧,成为数字时代优化治理结构,解决复杂社会问题的一种更为明智的方法。本文以开放数据生态系统中利益相关者互动为切入视角,运用网络计量分析的方法,研究中国开放数据实践中关键组织之间的互动行为。本研究的创新和贡献主要有三点,一是对发展中国家开放数据生态系统中利益相关者的互动协作情况进行直观化的实证说明。二是选择组织间的网络链接关系捕捉组织在现实中的互动轨迹,既是对运用网络计量学评估多類型组织协作模式等研究的补充,同时又增加了全球关于发展中国家开放数据研究的成果。三是希望通过本研究对开放数据实践中各个利益相关者互动协作提供意见和建议,解决现实障碍并激发期望收益。
开放数据生态系统中利益相关者之间的互动对于实现开放数据计划的成功和可持续发展至关重要。总的来说,前人文献研究中提到的开放数据生态系统中的主要利益相关者类型在中国的开放数据实践中都有出现,根据研究的结果,也可以发现各利益相关者互动模式的一些特点。中国的开放数据计划正在以政府主导的方式向前推进。政府组织的度中心性不高,但是却有更高的中介中心性。也就意味着,政府组织虽然和其他组织节点的直接互动不是最多的,但是在整个互动网络中有更大的信息传播优势,充当了信息整合联系的角色。政府部门致力于将企业组织、教育研究机构、非政府组织和国际组织等多方力量整合到整个数据开放使用的生态系统中去。这种整合不仅仅是从法律政策规制等管理的环境角度,更多的是将自身纳入到数据生产、开放、使用与创新的整个流程中去,引导数据的流通与价值创造。
企业组织与政府组织的积极紧密互动合作也是十分重要的特征。在共提及网络中,政府机构与特定的一些企业机构关系十分紧密。企业作为许多数据处理过程的中介,主动与政府部门建立合作关系,利用自身的技术优势、行业标准和产业优势,更主动地参与到社会公共服务与管理中。非政府组织的度中心性较高,中介中心性相对不是那么高,整体上与其他类型组织的合作互动相对较少,主要是同类型组织内部的培训交流学习,通过组织开展一系列的宣传活动,推动开放数据发展。教育研究机构在开放数据实践中的互动交流也有待进一步加强。整体的利益相关者互动网络还需要更多努力去优化提升。
地方政府官方数据开放平台的合作互动存在着碎片化的现象,地方政府之间的互动网络相对稀疏。这可能是因为在国家层面没有统一的开放数据平台之前,地方政府的数据平台就相当于是一种自下而上的政策实验创新,主要目的在于为全国范围内的创新和推广积累地方经验和知识。在互提及网络中,根据行政级别与隶属关系可以观察到平台之间的互动连接也存在4种形式,但是因为整体网络太稀疏,所以很难具体判断出哪种形式最为典型。同时,还发现城市规模和行政级别与地方政府开放数据指数呈显著正相关,经济发展水平影响不显著。
总体而言,通过考察中国开放数据生态中各利益相关者之间的互动,得出的结论是,中国的开放数据计划总体上是以政府组织主导的方式向前发展。在不同类型的组织沟通交流中,企业组织与政府组织的互动最为密切;在同一类型内部,非政府组织网络内部联系更为紧密,教育科研机构在开放数据网络中的参与互动还需要更加积极。此外,尽管部分地方政府在数据开放创新方面做出尝试,地方政府机构之间的协作互动网络依然相对稀疏。在具体的开放数据实践中,各利益相关者都需要进一步努力,优化合作网络。政府部门要开放除了食品安全、交通、公安和环境等领域之外更多的数据,吸引各类主体参与开放数据创新挑战。尤其是,要鼓励非政府组织和教育研究机构参与到开放数据的使用、深度挖掘、转化增值的过程中,增强社会公众与政府组织之间的参与互动,借助数据开放实践塑造更为透明的社会管理,更为精准化、个性化的公民服务。通过优势互补、资源协作,最大程度挖掘数据价值,共同解决社会问题,以顺应世界潮流,实现更好的数字治理。
由于技术手段的限制,该研究也存在一定的局限性。首先,种子站点的选择是基于经验判断的,未来还需要更加科学的方式开展研究。其次,考虑到链接分析本身的局限性,发生链接关系的原因往往是复杂多样的,这就导致有些节点的连接程度可能被夸大。最后,虽然现存的研究已经支持网络计量方法研究组织协作,但是仍然需要更多的实证研究来解释不同利益相关者的互动交流行为。
参考文献
[1]Styrin E,Luna-Reyes L,Harrison T.Open Data Ecosystems:An International Comparison[J].Transforming Government:People,Process and Policy,2017,(11):132-156.
[2]Davies T,Perini F.Researching the Emerging Impacts of Open Data:Revisiting the ODDC Conceptual Framework[J].Journal of Community Informatics,2016,12(2):148-178. [3]Canares M,Shekhar S.Open Data and Subnational Governments:Lessons from Developing Countries[J].The Journal of Community Informatics,2016,12(2).
[4]Mutuku L,Mahihu C.Understanding the Impacts of Kenya Open Data Applications and Services[OL].http://www.opendataresearch.org/content/2014/731/understanding-impacts-kenya-open-data-applications-and-services.html,2020-11-11.
[5]Gonzalezzapata F,Heeks R.The Multiple Meanings of Open Government Data:Understanding Different Stakeholders and Their Perspectives[J].Government Information Quarterly,2015,32(4):441-452.
[6]Van Schalkwyk F,Willmers M,Mcnaughton M.Viscous Open Data:The Roles of Intermediaries in an Open Data Ecosystem[J].Information Technology for Development,2016,22:68-83.
[7]Kassen M.Open Data and Its Institutional Ecosystems:A Comparative Cross-jurisdictional Analysis of Open Data Platforms[J].Canadian Public Administration,2018,61(1):109-129.
[8]Sayogo D,Yuli S B.Critical Success Factors of Open Government and Open Data at Local Government Level in Indonesia[J].International Journal of Electronic Government Research,2018,14:28-43.
[9]Dawes S S,Vidiasova L,Parkhimovich O.Planning and Designing Open Government Data Programs:An Ecosystem Approach[J].Government Information Quarterly,2016,33(1):15-27.
[10]Hellgren D,Nilsson C.Managing Factors that Affect Utilizations of Open Government Data:A Case Study of a Municipality[D].Department of Informatics,2018.
[11]Shkabatur J,Peled A.Sustaining the Open Government Data Movement Worldwide:Insights from Developing Countries[C]//Conference for E-Democracy and Open Government(CeDEM).IEEE,2016:172-179.
[12]Craveiro G,Albano C.Open Data Intermediaries:Coproduction in Budget Transparency[J].Transforming Government:People,Process and Policy,2017,(11):119-131.
[13]Jung K,Park H W.Tracing Interorganizational Information Networks During Emergency Response Period:A Webometric Approach to the 2012 Gumi Chemical Spill in South Korea[J].Government Information Quarterly,2016,33(1):133-141.
[14]Xu W W,Park J Y,Park H W.The Networked Cultural Diffusion of Korean Wave[J].Online Information Review,2015,39(1):43-60.
[15]Fonseca B P F,Fernandes E,Fonseca M V A.Collaboration in Science and Technology Organizations of the Public Sector:A Network Perspective[J].Science and Public Policy,2016,44(1):37-49.
[16]Van Schalkwyk F.Notes on Open Data Ecosystems[OL].http://www.opendataresearch.org/content/2014/719/notes-open-data-ecosystems,2020-11-11. [17]Maximilian H,Fredric S,Tom H.From Toddler to Teen:Growth of an Open Data Ecosystem[J].JeDEM-eJournal of eDemocracy and Open Government,2014,6(2).
[18]Harrison T M,Pardo T A,Cook M.Creating Open Government Ecosystems:A Research and Development Agenda[J].Future Internet,2012,4(4):900-928.
[19]Gupta A,Panagiotopoulos P,Bowen F.An Orchestration Approach to Smart City Data Ecosystems[J].Technological Forecasting and Social Change,2020,153:119929.
[20]Przeybilovicz E,Cunha M A.Open Government Data Programs:The Political System Matters?Revisiting the Dawes Ecosystem Model[C]//Proceedings of the 19th Annual International Conference on Digital Government Research:Governance in the Data Age.New York,NY,USA:ACM,2018:113.
[21]Oliveira M I S,Lóscio B F.What is a Data Ecosystem?[C]//Proceedings of the 19th Annual International Conference on Digital Government Research:Governance in the Data Age.New York,NY,USA:ACM,2018:74:1-74:9.
[22]Lnenicka M,Komarkova J.Big and Open Linked Data Analytics Ecosystem:Theoretical Background and Essential Elements[J].Government Information Quarterly,2019,36(1):129-144.
[23]Welle Donker F,Van Loenen B.How to Assess the Success of the Open Data Ecosystem?[J].International Journal of Digital Earth,2017,10(3):284-306.
[24]Freeman R E.Freeman Strategic Management:A Stakeholder Approach[M].Boston:Pitman,1984.
[25]Bryson J M.What to Do When Stakeholders Matter[J].Public Management Review,2004,6(1):21-53.
[26]Lee D.Building an Open Data Ecosystem-An Irish Experience[J].ACM International Conference Proceeding Series,2014:351-360.
[27]Attard J,Orlandi F,Auer S.Data Value Networks:Enabling a New Data Ecosystem[C]//IEEE/WIC/ACM International Conference on Web Intelligence(WI),2016:453-456.
[28]Jetzek T.Innovation in the Open Data Ecosystem:Exploring the Role of Real Options Thinking and Multi-sided Platforms for Sustainable Value Generation through Open Data[M].Carayannis E G,Sindakis S.Analytics,Innovation,and Excellence-Driven Enterprise Sustainability.New York:Palgrave Macmillan US,2017:137-168.
[29]Robinson P J,Johnson P A.Civic Hackathons:New Terrain for Local Government-Citizen Interaction?[J].Urban Planning,2016,1(2):65.
[30]Almind T C,Ingwersen P.Informetric Analyses on the World Wide Web:Methodological Approaches to‘Webometrics’[J].Journal of Documentation,1997,53(4):404-426.
[31]鮑玉芳,马建霞.科学论文被引频次预测的现状分析与研究[J].情报杂志,2015,34(5):66-71. [32]趙丹群.网络信息计量学研究与发展评述[J].情报理论与实践,2019,42(6):154-158,143.
[33]Park H W,Yoon J,Leydesdorff L.The Normalization of Co-authorship Networks in the Bibliometric Evaluation:The Government Stimulation Programs of China and Korea[J].Scientometrics,2016,109(2):1017-1036.
[34]Shapiro M A,Park H W.Climate Change and Youtube:Deliberation Potential in Post-video Discussions[J].Environmental Communication,2018,12(1):115-131.
[35]Mas-Bleda A,Thelwall M,Kousha K,et al.Do Highly Cited Researchers Successfully Use the Social web?[J].Scientometrics,2014,101(1):337-356.
[36]Lutz C,Hoffmann C P.Making Academic Social Capital Visible:Relating SNS-Based,Alternative and Traditional Metrics of Scientific Impact[J].Social Science Computer Review,2018:0894439317721181.
[37]郭道胜,匡婷婷.网络计量学国内研究的发展轨迹分析[J].情报探索,2018,(12):121-127.
[38]Kim J H,Park H W.Food Policy in Cyberspace:A Webometric Analysis of National Food Clusters in South Korea[J].Government Information Quarterly,2014,31(3):443-453.
[39]吴爱芝.信息技术进步与文献计量学发展[J].现代情报,2016,36(2):32-37.
[40]Ortega L,Ordua-Malea E,Aguillo F I.Are Web Mentions Accurate Substitutes for Inlinks for Spanish Universities?[J].Online Information Review,2014,(1):59-77.
[41]Thelwall M,Sud P,Wilkinson D.Link and Co-inlink Network Diagrams with URL Citations or Title Mentions[J].Journal of the American Society for Information Science and Technology,2012,63(4):805-816.
[42]Thelwall M,Sud P.Webometric Research with the Bing Search API 2.0[J].Journal of Informetrics,2012,6(1):44-52.
[43]国务院.中华人民共和国国务院令第711号:修订后的《中华人民共和国政府信息公开条例》[OL].http://www.gov.cn/zhengce/content/2019-04/15/content_5382991.htm,2019-12-05.
[44]国务院.国务院关于印发促进大数据发展行动纲要的通知[OL].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm,2019-12-05.
[45]中国互联网信息中心.第46次中国互联网络发展状况统计报告[OL].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/202009/P020200929546215182514.pdf,2020-11-11.
[46]Wang F.Understanding the Dynamic Mechanism of Interagency Government Data Sharing[J].Government Information Quarterly,2018,35(4):536-546.
[47]Zhao Y,Fan B.Exploring Open Government Data Capacity of Government Agency:Based on the Resource-based Theory[J].Government Information Quarterly,2018,35(1):1-12.
[48]徐晓林,李海波,马敏.区块链 旅游服务:创新前景与潜在挑战[J].中国行政管理,2019,(4):53-57,78.
[49]张聪丛,郜颍颍,赵畅,等.开放政府数据共享与使用中的隐私保护问题研究——基于开放政府数据生命周期理论[J].电子政务,2018,(9):24-36.
[50]Zhang N,Zhao X,Zhang Z,et al.What Factors Drive Open Innovation in Chinas Public Sector?A Case Study of Official Document Exchange Via Microblogging(ODEM)in Haining[J].Government Information Quarterly,2017,34(1):126-133. [51]Zhou Y,Long Y.SinoGrids:A Practice for Open Urban Data in China[J].Cartography and Geographic Information Science,2016,43(5):379-392.
[52]Wang C,Medaglia R,Zheng L.Towards a Typology of Adaptive Governance in the Digital Government Context:The Role of Decision-making and Accountability[J].Government Information Quarterly,2018,35(2):306-322.
[53]Zhao B.A Privacy Perspective of Open Government:Sex,Wealth,and Transparency in China[C]//Censorship,Surveillance,and Privacy:Concepts,Methodologies,Tools,and Applications.Hershey,PA,USA:IGI Global,2019:1294-1308.
[54]Kharrazi A,Qin H,Zhang Y.Urban Big Data and Sustainable Development Goals:Challenges and Opportunities[M].2016.
[55]万维网基金会.开放数据晴雨表(第4版)[OL].https://opendatabarometer.org/doc/4thEdition/ODB-4thEdition-GlobalReport.pdf,2019-12-05.
[56]张晓娟,孙成,向锦鹏.基于开放数据晴雨表的我国政府数据开放提升路径分析[J].图书情报知识,2017,(6):60-72.
[57]Jalali S M,Park H.Conversations About Open Data on Twitter[J].International Journal of Contents,2017,13:31.
[58]Jung K,Park H W.Citizens Social Media Use and Homeland Security Information Policy:Some Evidences from Twitter Users During the 2013 North Korea Nuclear Test[J].Government Information Quarterly,2014,31(4SI):563-573.
[59]Acharya S,Park H W.Open Data in Nepal:A Webometric Network Analysis[J].Quality and Quantity,2017,51(3SI):1027-1043.
[60]复旦大学数字与移动治理实验室.2018中国开放数林指数(下半年)[OL].http://ifopendata.fudan.edu.cn/static/papers/2018下半年中国开放数林指数.pdf,2019-12-05.
[61]Robinson-Garcia N,Van Leeuwen T N,Ràfols I.Using Altmetrics for Contextualised Mapping of Societal Impact:From Hits to Networks[J].Science and Public Policy,2018,45(6):815-826.
[62]开放知识基金会中国组织.中国大陆开放数据运动时间线[OL].http://timemapper.okfnlabs.org/okfncn/open-data-china-timeline-cn#0,2019-12-05.
[63]开放知识基金会中国组织.2014开放数据日中国区活动[OL].https://planet.okfn.org/category/开放数据日/,2019-12-05.
[64]SODA.上海开放数据创新应用大赛[OL].http://soda.data.sh.gov.cn/reports.html,2019-12-05.
[65]Heilmann S.Policy Experimentation in Chinas Economic Rise[J].Studies in Comparative International Development,2008,43(1):1-26.
[66]Yoon J,Park H W.Triple Helix Dynamics of South Koreas Innovation System:A Network Analysis of Inter-regional Technological Collaborations[J].Quality and Quantity,2017,51(3):989-1007.
[67]Park H W,Kluver R.Trends in Online Networking Among South Korean Politicians—A Mixed-method Approach[J].Government Information Quarterly,2009,26(3):505-515.
[68]Wasserman S,Faust K.Social Network Analysis:Methods and Applications(Structural Analysis in the Social Sciences)[M].Cambridge University Press,1994.
(責任编辑:陈媛)
基金项目:国家社会科学基金重大项目“数字政府建设的安全治理体系研究”(项目编号:20ZDA038);国家自然科学重点项目“非传统安全问题风险识别与防范机制——以智慧城市治理中的信息共享与使用为例”(项目编号:71734002)。
作者简介:张聪丛(1991-),女,博士研究生,研究方向:数字政府治理。陈涛(1980-),男,教授,博士生导师,研究方向:智慧城市、电子政务。
通讯作者:黄艳(1975-),女,教授,硕士生导师,研究方向:公共政策评估、非传统安全。
摘要:[目的/意义]开放数据生态系统中利益相关者之间的互动对于实现开放数据计划的成功和可持续发展至关重要。[方法/过程]本研究以中国开放数据实践中关键组织的网站链接网络为研究对象,使用Webometric Analyst 4.1和UCINET进行社会网络分析,了解中国开放数据生态系统中各个利益相关实体的互动交流现状,分析其网络互动模式,评估国家在开放和利用数据方面的准备情况,为开放数据实践行为提供建议和参考。[结果/结论]中国的开放数据计划总体上是以政府组织主导的方式向前发展。在不同类型的组织沟通交流中,企业组织与政府组织的互动最为密切;在同一类型内部,非政府组织网络内部联系更为紧密;教育科研机构在开放数据网络中的参与互动还需更加积极。尽管部分地方政府在数据开放创新方面做出尝试,地方政府机构之间的协作互动网络依然相对稀疏。各利益相关者需扩大互动的深度和广度,主动积极构建开放数据生态系统,促进互动合作网络的优化,顺应世界数字化发展潮流,实现更好的数字化治理。
关键词:开放数据;生态系统;互动;利益相关者;网络计量学;中国
DOI:10.3969/j.issn.1008-0821.2021.04.011
〔中图分类号〕D035-39〔文献标识码〕A〔文章编号〕1008-0821(2021)04-0101-18
Mapping the Interactions Among Stakeholders in the Open Data Ecosystem
——A webometric Network Analysis from China
Zhang Congcong1Chen Tao1Huang Yan2*
(1.College of Public Administration,Huazhong University of Science and Technology,Wuhan 430074,China;
2.Law and Business School,Wuhan Institute of Technology,Wuhan 430074,China)
Abstract:[Purpose/Significance]Interactions among stakeholders in the open data ecosystem are dominant to achieve success and sustainable development of open data initiative.[Method/Process]This study focused on the hyperlink networks extracted from the websites of critical organizations engaged in open data to explore the interactions of the entities through the inter-linkage analysis and co-mention analysis by using Webometric Analyst 4.1 and UCINET.[Result/Conclusion]Findings showed that the Open Data Initiative was generally moving forward in a government-led manner.Enterprise organizations interacted with government organizations most closely among different types of organizations.While within the same category,the NGO network was more closely interconnected.In addition,the network between local governments in China was relatively sparse because their explorations of open data were at different stages.More efforts were needed to promote the optimization of cooperative networks.
Key words:open data;ecosystem;interactions;stakeholders;webometrics;China
隨着开放数据在世界范围内蓬勃发展,越来越多的发展中国家积极参与其中。在追踪不同国家开放政府数据生态系统时发现,不同的社会制度背景会影响开放数据实践持续推进和制度化的可能性[1],研究发展中国家的数据开放问题将会为整个开放数据的知识基础贡献诸多经验。2013年,世界银行联合开放数据研究所和开放知识基金会共同提出了发展中国家开放数据项目(ODDC),旨在讨论发展中国家的数据生态系统、权力下放、新兴影响以及各部门之间的联系,以根据发展中国家的本土情况促进开放数据的实施,帮助发展中国家的决策者和公民理解并受益于开放数据[2]。考虑到开放数据在机构合作、公众参与、创新增长方面的潜能,发展中国家开始在国家层面发布开放政府数据行动计划,通过信息公开或数据开放回应公众需求[3]。 越来越多的组织意识到开放数据使用可能带来的发展潜力,更多实体参与到开放数据生态系统中来,期望分享数据红利。在基本满足更多数据尽可能对更多人开放的数据共享需求之后,如何实现数据在各个利益相关者之间流通使用成为开放数据生态系统可持续性发展的关键。开放数据生态系统主张以系统的、互动的、嵌入的观点探究各要素之间的关系,综合考虑对干预措施、社区反馈、技术可用性的认识,关注各个实体的互动协作网络[4]。其中,政府机构、企业组织、数据中介、研究人员、记者等群体都是整个开放数据生态系统的基本要素[5-7],承担数据生产、处理、使用和创新的各项功能。这些机构之间的互动协作是推动政府数据开放成功的重要决定因素[8-9]。
但是,在具体的开放数据实践中,大多数发展中国家缺乏多层次合作框架支持开放数据创新使用,很难保持开放数据的可持续性[10-11]。各类组织之间缺乏合作意识,导致各个利益相关者不能及时互动,从而降低数据使用效率,增加数据安全风险[3,8,12]。加之,已有开放数据的研究虽然承认利益相关者之间互动协作对价值创造的重要性[12],却鲜有研究对发展中国家开放数据生态系统中的利益相关者的互动协作情况进行直观化的实证说明。为了弥补这个研究差距,本文主要关注中国开放数据生态系统中各个利益相关实体的互动交流,尝试借助分析工具可视化其互动模式,分析各利益相关者之间的合作行为特点,评估国家在开放和利用数据方面的准备情况,促进相关研究公共知识库的发展,为开放数据实践行为提供建议和参考。此外,不同社会制度背景也会影响开放数据推进情况,中国的开放数据实践落地实施往往都在地方政府层面,地方政府官方平台之间的互动也是十分重要的。
因此,对中国开放数据生态系统中利益相关者之间互动关系的研究可以分为两个问题,一是中国开放数据实践中各个参与组织的互动现状与模式;二是地方政府官方平台在开放数据实践中的互动情况。在具体研究中,借鉴已有基于网络计量视角对多组织协作模式的研究[13-15],采用网络计量学方法,选取中国开放数据项目中的关键组织,如政府组织、非政府组织、教育研究机构以及企业组织(包括技术公司、基礎设施供应商、运营商等)为研究对象,分析其网络链接行为网络结构特征,了解和评估多类型组织的互动协作模式。
1背景与文献综述
1.1开放数据生态系统
在关于信息通信技术如何推动政府管理变革的研究中,生态系统的概念已受到一定程度的关注,这些在有关开放政府或开放数据的讨论中都有体现[16-17]。Harrison T M等[18]回顾了开放政府的文献后,建议从生态系统的角度研究开放政府的概念,有目的地构建开放政府生态系统,关注政府与用户和组织的互动。在整合相关研究的基础上,Dawes S S等[9]提出了一个由利益相关者、政策、实践、关系和影响组成的开放政府数据生态系统模型,随后研究者也对该框架进行了进一步完善和验证[19-20]。开放数据生态系统与数据生态系统[21],链接数据生态系统[22]和开放政府生态系统[18]等概念类似,其核心主张是从系统互动和嵌入式的角度探讨各种元素之间的关系[23]。在生态系统内,许多参与者相互交流以生成和使用数据,为创建、管理和维持数据共享计划提供环境[21]。同样,评估开放数据生态系统成功与否的最重要指标之一就是利益相关者是否充分互动和有效参与[23]。
作为开放数据生态系统的基本要素,利益相关者及其行为一直是值得关注的。采用Freeman R E[24]对利益相关者的定义,开放数据计划的利益相关者既可以是政府内部的(例如,负责制定和实施政策的政府组织),也可以是政府外部的(例如,受政府行为或规则影响的行业、社区或个人)[25]。这些利益相关者群体通常在参与推动开放数据计划发展、数据开放使用和深度开发中扮演着多种角色。为了保障开放数据生态系统的可持续性,数据供需方以及利益相关者之间存在大量的联系和依赖。开放数据计划逐渐积累了一些基于生态系统理论的最佳实践的经验[26]。来自英国的实践经验将利益相关者分为数据生产者、中间商和数据使用者[17]。Dawes S S等增加了政策制定者来表达政治维度因素对可开放数据计划可持续的重要影响[9]。随着数据成为许多产品和服务的基础,利益相关者可以使用数据,深度开发数据产品,参与数据市场,通过这些生态系统中的关键行动者的交互作用继续创造价值[27]。政府共享开放数据后,私营企业的管理者或开发者可以选择实际相关的数据作为提供免费信息的资源,从开放数据中寻找新的商业模式来刺激可持续的价值产生[28]。非政府组织或技术人员通过参与黑客马拉松的开放数据竞赛,使用数据创建应用程序,促进社会透明或提供公民服务,增进地方政府与公民互动[29]。政府组织则可以在这些互动中获得关于市政开放数据集的有价值的反馈,从而及时回应、告知和发展未来开放数据的版本。
1.2网络计量学相关研究
21世纪互联网成为通信和信息传播的重要媒介,海量规模的信息资源在网络上被公开表达访问。正是在这样的背景下,网络计量学开始出现。网络计量学最初被用于万维网的一般信息学分析[30],如评价和预测引文影响力等,具有鲜明的引文分析的特点[31]。随着社会网络分析范式的广泛应用,“链接”关系的推广和泛化[32],网络计量学与社会网络分析逐渐结合,用于研究与特定网站集合之间的链接,通过测量超链接网络的不同定量指标,分析整体的网络结构与关键节点特征,判断网络信息流动方向、节点的绩效表现和影响力[13,33-36]。具体而言,基于Web的网络分析开始在人文社会科学调查中越来越多地出现[37],被广泛用于了解和评估多类型组织的协作模式[15]。通过评估超链接网络的节点中心性指数等指标,揭示行动者之间的交流模式[38],洞察组织间关系[13],确定不同行动者在创新扩散过程中的角色[36]。
然而,由于搜索引擎中用于自动和手动收集超链接计数的工具已经在2012年被关闭等技术原因,基于超链接分析的网络计量分析遭遇困境[39]。研究者积极探索寻找替代性的数据源来取代传统的基于超链接的网络分析方法,研究发现基于标题和基于URL提及分析与超链接分析的指标存在高度相关性,认为基于URL或标题提及的测量指标是在二进制网络和加权网络中替换超链接的最佳选择[40-41]。Thelwall M等[42]综合考虑数据负担能力、软件编程和成本等条件,提出使用Bing Search API 2.0是从搜索引擎API收集用于Web计量分析原始数据的最佳选择。在此之后,网络计量分析继续不断向不同学科发展。因此,本研究使用Bing Search API 2.0收集万维网上中国开放数据计划中利益相关者网站的URL计量原始数据,借助Webometric Analyst 4.1对其链接引用网络进行分析。 1.3中国的开放数据
在过去10年中,开放数据的讨论主要是在西方发达国家的背景下展开的。作为世界上重要的发展中国家,中国也在努力促进信息公开和数据开放,释放数据活力,以顺应世界潮流,提高政府透明度,提升公共服务能力,从而实现更好的治理。一方面,中国在信息公开方面不断地制度化成果,为开放数据实践提供了制度支撑与发展方向。2008年,中华人民共和国国务院颁布施行《中华人民共和国政府信息公开条例》,将提高政府透明度,充分发挥政府信息服务于人民生产生活和社会经济活动的作用写入法律。2019年修订后的《中华人民共和国政府信息公开条例》强调,行政机关公开政府信息应坚持以公开为常态、不公开为例外[43]。国务院2015年发布《促进大数据发展行动纲要》将开放数据正式列为全国十大重点项目之一,肯定了其在推动转型和增强竞争力方面的重要意义[44]。中国政府一直致力于推进互联网基础设施的建设和使用,拥有开展数据开放的巨大优势。中国互联网络信息中心发布的第46次《中国互联网络发展状况统计报告》表明,截至2020年6月,全国网民规模达9.40亿,互联网普及率达67.0%,是2009年的28.9%的两倍多[45]。
另一方面,相关的学术研究成果也在逐步增加,中国公共部门的开放创新正逐渐引起人们对数字政府背景下政府透明度、开放数据创新、跨部门数据共享、政府开放数据能力、数字驱动的公众参与等问题的关注[46-50]。研究者对中国开放城市地理数据的案例研究表明,随着数据存储和高性能计算的发展,数据众包平台计划极大促进共享和互操作性[51]。针对快速变化环境中的相关技术和公民的要求,Wang C等[52]从4个IT相关项目中政府和非政府组织之间的合作出发,根据合作过程中的决策的权力和责任的分配应对,提出了3种适应性治理类型。在开放数据实践过程中,研究人员特别考虑了开放政府(透明度)和隐私保护之间存在的争议和动态关系[53]。此外,还有一些开放数据应用的案例研究,分析城市大数据对更多与可持续发展目标相关的创新目标和指标的积极影响[54]。在由万维网基金会(The World Wide Web Foundation)、开放数据研究所(Open Data Institute)联合开发的开放数据晴雨表(Open Data Barometer)第4版全球评估报告中,中国在2016年被调查的115个国家和地区中排名第71位[55]。总体看来,政府数据开放准备度尚可,尤其是地方政府行动表现突出,但执行度和影响力还比较落后,数据集的开放程度不高,政府数据开放对政治、社会、经济的影响不足[56]。
2数据和方法
2.1数据收集
网络计量的一些研究已经证实了使用搜索引擎和社交媒体工具获取原始数据的可行性和可靠性[57-59]。为了回应文章的两个研究问题,本文的数据收集也是分为两个部分。针对第一个研究问题,也就是探究中国开放数据实践中各个参与组织的互动现状与模式,本文参考国际研究者使用谷歌和Twitter搜索用于选择种子站点的方法,使用更符合中国情境的百度和微博来选择种子站点,数据搜索时间截止2019年1月31日。首先,参考Acharya S等[59]对尼泊尔开放数据网络模式研究一文中的搜索策略和组织分类标准,选择关键字“开放数据(Open Data)”“开放中国(Open China)”和“开放政府(Open Government)”在百度上进行中英文搜索。类似地,使用标签#开放数据(Open Data)和#开放中国(Open China)和#开放政府(Open Government)在微博上进行中英文搜索。然后,访问和阅读各自主页的结果,判断选择与开放数据项目相关的组织机构,追踪并手动访问他们的网站,以确定他们在中国开放数据项目中的角色和重要性[5]。这里文章主要基于组织的官方描述将组织类型划分为政府组织(简称GO)、企业组织(简称EO)、教育研究机构(简称ERI)和非政府组织(简称NGO),并将NGO进一步区别是否为国际组织(简称IO)。最后,列出种子网站的详细信息和特征,包括它们的名称、组织类型、在中国开放数据中扮演的角色以及它们的网站地址或URL等,结果如表1所示。
针对第二个研究问题,为了更好地了解中国地方政府官方平台在开放数据实践中的互动情况,文章对地方政府官方数据开放平台的网站进行分析。“中国开放数林”指数由复旦大学数字与移动治理实验室出品,是国内第一个专门针对地方政府数据开放的系列评估报告。本文根据复旦大学数字与移动治理实验室发布的《中国地方政府数据开放报告(2018下半年)》确定种子站点[60],同时列出了地方政府、平台名称、简称、建立日期、地区、行政级别和URL,结果如表2所示。
2.2数据分析
首先,在选定了种子网站之后,使用Bing API运行高级布尔搜索,根据URL引用计算与站点链接的相关外部网站,以获得与基本查询匹配的外部网站列表,数据搜索日期为2019年1月31日。其次,使用Webometric Analyst 4.1(http://lexiurl.wlv.ac.uk)对数据进行分析,Webometric Analyst是一个基于Windows的免费程序,用于Altmetrics、引文分析、社交网络分析和网络计量学分析[58]。本研究主要选择互提及网络分析(Inter-mentioned Network Analysis)和共提及网络分析(Co-mention Network Analysis),关注各利益相关机构之间在网络中的结构关系与利益相关者在网络交流中的相似状况。其中,互提及网络示意图说明了站点集合之间的互连性模式,能够表示两个组织之间建立的最强烈的联系,所以用于刻画机构之间在网络上的结构关系。共提及网络分析基于引用一对目标站点的外部站点数来确定,这些共同之处显示出一些不直接相关但同等重要的节点,可以揭示利益相關者的网络交流状况。此外,利用UCINET测度整体网络层面的密度、参与者与连接关系,节点层面的中心性指标,尝试将不同的利益相关者的复杂关系网络可视化[61],以便更好理解和评估多种类型组织中的协作模式[15]。 3结果
3.1基本情况描述
开放数据实践十分依赖于其所在的背景环境,并且往往会受到基本管理框架的影响[7]。与现有的分散生态系统、集中生态系统和跨境开放数据生态系统等开放数据模型不同,中国的开放数据实践呈现出更为复杂的局面。非政府组织、企业组织、政府组织和教育研究机构通过合作,积极推进开放数据项目的准备与实施。例如,2013年2月中国加入开放知识网络,2014年初与数据新闻、城市规划、环境保护、数据科学等多个社区共同发起“开放数据中国”活动,以构建和培育开放数据生态系统为社区使命[62]。2014年1月22日,开放知识基金会的中国地方机构举办了首届“北京开放数据日”开放数据黑客马拉松活动[63]。2015年,由中国工业设计研究院、开放数据中国、上海交通大学、复旦大学和上海市政府共同发起的上海开放数据应用创新大赛(Shanghai Open Data Apps,SODA)正式启动[64]。到目前为止,SODA大赛已经成功举办了四届,在城市交通、城市安全、食品安全、产业发展和城市生活等诸多方面实现了从数据到价值创造的转化。大赛高度重视国际合作与交流,多次与英国、美国、瑞士等国开展深入交流与合作。
此外,在2015年之前,中国的一些地方政府已经开始进行开放政府数据的试点试验,这些试验过程也为国家层面的政策制定提供了强有力的纠偏机制[65]。在2012年,上海市政府推出了全国第一个公开数据门户,上海市政府数据服务网(datashanghai.gov.cn),正式提供一站式政府数据资源。首都北京也在同年开通了北京市政务数据资源网(bjdata.gov.cn),自此,区、市、省各级地方政府开始逐渐建立和完善开放数据门户网站。截至2018年10月31日,已有57个地方先后推出了各自的平台,包括8个省(自治区)、2个直辖市、9个副省级城市和38个地级市,具体的时间线分布如图1所示。
注:▲代表省份(自治区);●代表城市。图1地方政府开放数据平台建设时间表
3.2组织间互动交流的模式
首先对按照数据收集步骤得到的表1中的种子站点进行简单描述分析。可以看出,最后选择的与中国开放数据相关的利益相关者有46个,涵盖了11个政府组织、13个企业组织、15个非政府组织以及7个教育研究机构。其中,政府组织主要涉及政策制定、交通气象、知识产权等机构;企业组织里面涉及到了ICT供应商、开发者、技术公司等;非政府组织涉及到了网络社区、国际组织、行业协会等。这些角色基本覆盖了开放数据生态系统中的各个功能环节,在一定程度上体现了开放数据生态系统复杂性。
借助Webometric Analyst 4.1得到中国开放数据关键利益相关者的互提及網络,如图2所示,以及共提及网络,如图3所示。一般用网络密度指标对网络整体结构情况进行判断,通过计算网络密度判断网络对节点的影响程度。网络密度是实际连接关系数量除以成员之间的最大连接数,代表了成员之间的平均连接数和个体成员与其他成员的亲密程度[66]。图2所代表的有向(非对称)互提及网络的密度值为0.1942,图3所代表的无向共提及网络的密度值为0.8213,这表明整体看来共提及网络对其结构中的个体影响较大,相互提及网络节点间相对分散,关系更加集中。为了更加深入细致了解各利益相关者的互动交流行为,接下来将对互提及网络和共提及网络进行科学量化的分析。
3.2.1互提及网络分析
互提及网络是基于一对网站之间的非对称(定向)相互提及数的表示形式,该图指示了站点集合之间的相互连接模式,可以反映机构之间在网络上的结构关系。网络图中的颜色和形状代表不同的组织类型,绿色三角形代表非政府组织(NGOs),红色正方形代表政府组织(GOs),黄色圆圈代表企业组织(EOs),蓝色菱形代表教育研究机构(EIRs),箭头表示URL的方向。直观上看,www.baidu.com、www.github.com、www.oschina.net、www.uestc.edu.cn和www.mof.gov.cn占据了整个网络的中心位置。这几个节点分别属于企业组织、政府组织(国际组织)、非政府组织、教育研究机构和政府组织。这些不同类型的组织之间基于各自的功能性分工又相互紧密联系。在非政府组织中,如www.weibo.com、www.github.com、www.oschina.net等网站与其他节点,尤其是国际非政府组织如www.github.com、www.okfn.org等网站有着密切的联系。www.miit.gov.cn、www.cac.gov.cn、www.stats.gov.cn、www.sic.gov.cn等政府组织与其他类型的组织联系密切,涉及到了整个网络中较为集中的联系。
度中心性(Degree Centrality)是度量每个节点组织在交流网络中重要性的最直接指标。其通过计算一个节点与网络中所有其他节点直接接触的次数,来反映该节点在网络中的重要性和影响力分布,一个节点的节点度越大就意味着这个节点的度中心性越高,该节点在网络中就越重要[67]。具体而言,入度(Indegree Centrality)显示来自网络中节点到节点的传入连接的数量,而出度(Outdegree Centrality)则显示了自节点的外部连接的数量。在整个互动沟通的网络中,与其他行动者联系较多的组织更能够有效地控制和影响处于核心地位的网络。表3分别列出了入度和出度最高的前20个网站。企业组织中百度在两个测量值上都有较高的结果(Indegree Centrality=189 997,Outdegree Centrality=390 316),非政府组织中的国际组织Github也有相对高的数值(Indegree Centrality=189 427,Outdegree Centrality=178 698),这都较为直接地反映出他们在整个网络中的重要性。在前20个节点中,新浪微博、百度、Github、Pivotal中国、开源中国社区和中华人民共和国财政部的入度值排名靠前,也就是说这些节点组织受到了其他节点组织的高度关注,其他节点组织对这些节点组织在网络中的重要程度和声望是比较认同的,因此这些节点更可能引导整个网络交流的视角和内容。在出度排名前20的站点中,有6个政府组织,约占政府组织总数的54.5%;5个企业组织,约占企业组织总数的38.5%;8个非政府组织,约占非政府组织总数的53.3%;1个教育研究机构,约占教育研究机构总数的14.3%。这些节点在整个互动网络中十分努力地与其他节点取得关联,能够从其他成员那里获得很多信息知识。 中介中心性(Between Centrality)是以经过某个节点的最短路径数目来刻画节点重要性的指标,主要衡量网络中的桥接关系。经过一个点的最短路径的数量越多,就说明它的中介中心度越高,对网络中信息流动的影响越大[68]。表4列出了中介中心性最高的前20个网站。www.baidu.com中介中心性最高(740.417),其次是www.github.com,中介中心性值达到504.534。就每种不同类型的组织而言,在所有的教育研究机构中,中介中心性最高的是电子科技大学。中华人民共和国互联网信息办公室在政府组织里面中介中心性值最高(180.571)。这些节点处在与其他点相互之间联系的捷径上,是其他组织之间的桥梁,可以帮助那些没有直接联系到其他组织的参与者取得关键信息和资源,缩小了不同小协作团体之间的信息差距。
3.2.2共提及网络分析
共提及网络分析是基于引用一对目标站点的外部站点数来确定的,可以显示出一些不直接相关但是同等重要的节点,反映不同利益相关者在网络交流中的相似度。网络图中的颜色和形状代表不同的组织类型,绿色三角形代表非政府组织(NGOs),红色正方形代表政府组织(GOs),黄色圆圈代表企业组织(EOs),蓝色菱形代表教育研究机构(EIRs)。由于几乎所有的节点都被共同提及,原始的共提及网络关系十分稠密。为了更加清楚直观地观察各个组织的互动交流模式,因而选择共同提及次数大于400和共同提及次数大于800的共提及网络图,来展示他们之间的关系,如图3和图4所示。
非政府组织中的okfn.org和dca.org.cn、政府机构中的cac.gov.cn、sic.gov.cn和stats.gov.cn是最常被共提及的網站。站点为bigdata-research.org的教育研究机构也在网络中占据了关键位置。例如,okfn.org和www.cybersac.cn共被提及917次;www.bigdata-research.org和www.oschina.net共被提及917次;www.bigdata-research.org和www.cac.gov.cn共被提及889次;www.bigdata-research.org和www.mof.gov.cn共被提及856次。此外,针对每种类型组织内部而言,非政府组织之间经常会被共提及,okfn.org和www.opendatacenter.cn被共提及次数多达1 051次;okfn.org和opensourcecloud.cn的共提及次数达到1 033次;OKFN中国办事处cn.okfn.org和okfn.org共提及更是达到15 573次。
大多数时候,同一群有着相同目的的利益相关者会被一起提及,因为他们分享了一些同等重要的东西。从图3和图4可以看出,外部网站对中国开放政府数据相关提及引用时,一般提到了政府组织,基本上很大程度也会一起提到相关的非政府组织。同时,政府机构与特定的一些企业机构关系也是十分紧密。教育研究机构www.opendatacenter.cn与政府组织、非政府组织、企业组织会经常被共同提及,但是,其他教育研究机构却并不活跃。不同领域的联系也在一定程度表明了多种类型组织在中国开放数据实践上的合作互动。就每种组织类型内部的这些机构而言,大部分的企业组织其实并没有被频繁地共同提及,政府组织内部可能由于不同的侧重,共同提及的也比较少。非政府组织之间的目标或者角色明显会更加集中统一,经常互相支撑而被共同提及。
3.3地方政府官方平台的互动
同样,借助网络计量学对中国地方政府官方平台在开放数据实践中的互动情况进行分析。表2已经列出了地方政府官方数据开放平台的基本情况。《中国地方政府数据开放报告(2018下半年)》评估了57个地方政府平台,其中包含8个省级(自治区)政府平台、2个直辖市、9个副省级城市和38个地级市。图5显示了地方政府官方数据开放平台的互提及网络。整体看来,每一对站点之间的链接很少,网络十分稀疏。贵州省和上海市的平台处于网络的核心位置,与其他节点连接较为紧密。依然可以看到4种类型的连接关系,即第一种是省级政府平台与省级政府平台之间的联系,即广东省(www.gddata.gov.cn)和贵州省(www.gzdata.gov.cn);第二种是具有隶属关系的行政上下级平台之间的联系,即广东省(www.gddata.gov.cn)和惠州市(data.huizhou.gov.cn);第三种是不具有隶属关系的省市之间的联系,如贵州省(www.gzdata.gov.cn)和广州市(www.datagz.gov.cn);第四种则是不同城市之间的联系,如上海市(www.datashanghai.gov.cn)和贵阳市(www.gyopendata.gov.cn)。
为了便于在同一层次上进行深入比较,避免省政府对各省所辖城市的压力,接下来选取49个城市政府官方数据开放平台进行共提及分析,这49个节点几乎都存在共提及关系,为了更加清晰直观地观察,呈现了共提及次数超过250次的网络图,如图6所示。其中,红色圆圈代表省级行政级别的直辖市,黄色圆圈代表副省级城市,蓝色圆圈代表地级市。很明显,共提及图比互提及的密度大,说明外界站点对这些站点一般都是同时提及。在这个网络中,上海、北京和南京3个城市相对比较活跃,也更加容易被外部站点提及。
图7显示了《中国地方政府数据开放报告(2018下半年)》中49个地方政府官方数据开放平台的评估结果。其中,贵阳排名第一,佛山、哈尔滨、上海和广州紧随其后。正如图7所示,积极参与政府开放数据的城市基本上位于中国东部和南部,但表现最好的是位于中国西南部的贵阳。这可能是因为阿里、腾讯等许多知名企业组织在贵阳建立大数据中心,进一步带动了地区整体数字化发展。此外,为了进一步了解哪些因素可能影响地方政府官方数据开放平台开放数据绩效,本研究尝试考虑城市的行政级别、经济发展水平和城市规模3个基本属性与开放数据指数的相关关系。具体操作:城市行政级别分为3级,省级、副省级和地级市;使用地区人均国内生产总值来衡量经济发展水平,数据来自各城市统计年鉴;按照国务院2014年发布的《国务院关于调整城市规模划分标准的通知》,将城市按照城区常住人口划分为超大城市(超过1 000万),特大城市(500万~1 000万),Ⅰ型大城市(300万~500万),Ⅱ型大城市(100万~300万),中等城市(50万~100万),Ⅰ型小城市(20万~50万),Ⅱ型小城市(20万以下),具体数据来源于《中国城市建设统计年鉴》。 表5显示了开放数据指数、行政级别、经济发展水平和城市规模之间的Spearman相关系数。总体而言,城市规模和行政级别与开放数据指数呈显著正相关,经济发展水平影响不显著。可以发现,城市的行政级别与城市政府数据开放绩效在0.01的显著水平下呈正相关,也就是说,行政级别越高,该政府平台数据开放的总体表现越好。这在中国语境下也不难解释,地方政府创新实践或者对于国家政策意愿的执行,一定程度上需要整体政治资源、经济资源和基础设施资源较好的地区,城市行政级别越高,相关的资源支持机会就会越多,有利于这些实践的实施。此外,城市规模越大,其政府数据的积累体量就越大,政府利用信息技术进行社会管理与公共服务的动机就越强,越有利于激励地方政府进行整体的数字化建设。而经济发展水平没有显示出显著的相关性,可能是因为开放政府活动的整体支出其实并不是很大部分,对于地方经济情况要求不高。
4结论与讨论
越来越多的数据被开放使用,给公众和社会各个主体赋予了更多的能力和权力。依托信息技术发展,推进多主体协作互动,充分发挥公众智慧,成为数字时代优化治理结构,解决复杂社会问题的一种更为明智的方法。本文以开放数据生态系统中利益相关者互动为切入视角,运用网络计量分析的方法,研究中国开放数据实践中关键组织之间的互动行为。本研究的创新和贡献主要有三点,一是对发展中国家开放数据生态系统中利益相关者的互动协作情况进行直观化的实证说明。二是选择组织间的网络链接关系捕捉组织在现实中的互动轨迹,既是对运用网络计量学评估多類型组织协作模式等研究的补充,同时又增加了全球关于发展中国家开放数据研究的成果。三是希望通过本研究对开放数据实践中各个利益相关者互动协作提供意见和建议,解决现实障碍并激发期望收益。
开放数据生态系统中利益相关者之间的互动对于实现开放数据计划的成功和可持续发展至关重要。总的来说,前人文献研究中提到的开放数据生态系统中的主要利益相关者类型在中国的开放数据实践中都有出现,根据研究的结果,也可以发现各利益相关者互动模式的一些特点。中国的开放数据计划正在以政府主导的方式向前推进。政府组织的度中心性不高,但是却有更高的中介中心性。也就意味着,政府组织虽然和其他组织节点的直接互动不是最多的,但是在整个互动网络中有更大的信息传播优势,充当了信息整合联系的角色。政府部门致力于将企业组织、教育研究机构、非政府组织和国际组织等多方力量整合到整个数据开放使用的生态系统中去。这种整合不仅仅是从法律政策规制等管理的环境角度,更多的是将自身纳入到数据生产、开放、使用与创新的整个流程中去,引导数据的流通与价值创造。
企业组织与政府组织的积极紧密互动合作也是十分重要的特征。在共提及网络中,政府机构与特定的一些企业机构关系十分紧密。企业作为许多数据处理过程的中介,主动与政府部门建立合作关系,利用自身的技术优势、行业标准和产业优势,更主动地参与到社会公共服务与管理中。非政府组织的度中心性较高,中介中心性相对不是那么高,整体上与其他类型组织的合作互动相对较少,主要是同类型组织内部的培训交流学习,通过组织开展一系列的宣传活动,推动开放数据发展。教育研究机构在开放数据实践中的互动交流也有待进一步加强。整体的利益相关者互动网络还需要更多努力去优化提升。
地方政府官方数据开放平台的合作互动存在着碎片化的现象,地方政府之间的互动网络相对稀疏。这可能是因为在国家层面没有统一的开放数据平台之前,地方政府的数据平台就相当于是一种自下而上的政策实验创新,主要目的在于为全国范围内的创新和推广积累地方经验和知识。在互提及网络中,根据行政级别与隶属关系可以观察到平台之间的互动连接也存在4种形式,但是因为整体网络太稀疏,所以很难具体判断出哪种形式最为典型。同时,还发现城市规模和行政级别与地方政府开放数据指数呈显著正相关,经济发展水平影响不显著。
总体而言,通过考察中国开放数据生态中各利益相关者之间的互动,得出的结论是,中国的开放数据计划总体上是以政府组织主导的方式向前发展。在不同类型的组织沟通交流中,企业组织与政府组织的互动最为密切;在同一类型内部,非政府组织网络内部联系更为紧密,教育科研机构在开放数据网络中的参与互动还需要更加积极。此外,尽管部分地方政府在数据开放创新方面做出尝试,地方政府机构之间的协作互动网络依然相对稀疏。在具体的开放数据实践中,各利益相关者都需要进一步努力,优化合作网络。政府部门要开放除了食品安全、交通、公安和环境等领域之外更多的数据,吸引各类主体参与开放数据创新挑战。尤其是,要鼓励非政府组织和教育研究机构参与到开放数据的使用、深度挖掘、转化增值的过程中,增强社会公众与政府组织之间的参与互动,借助数据开放实践塑造更为透明的社会管理,更为精准化、个性化的公民服务。通过优势互补、资源协作,最大程度挖掘数据价值,共同解决社会问题,以顺应世界潮流,实现更好的数字治理。
由于技术手段的限制,该研究也存在一定的局限性。首先,种子站点的选择是基于经验判断的,未来还需要更加科学的方式开展研究。其次,考虑到链接分析本身的局限性,发生链接关系的原因往往是复杂多样的,这就导致有些节点的连接程度可能被夸大。最后,虽然现存的研究已经支持网络计量方法研究组织协作,但是仍然需要更多的实证研究来解释不同利益相关者的互动交流行为。
参考文献
[1]Styrin E,Luna-Reyes L,Harrison T.Open Data Ecosystems:An International Comparison[J].Transforming Government:People,Process and Policy,2017,(11):132-156.
[2]Davies T,Perini F.Researching the Emerging Impacts of Open Data:Revisiting the ODDC Conceptual Framework[J].Journal of Community Informatics,2016,12(2):148-178. [3]Canares M,Shekhar S.Open Data and Subnational Governments:Lessons from Developing Countries[J].The Journal of Community Informatics,2016,12(2).
[4]Mutuku L,Mahihu C.Understanding the Impacts of Kenya Open Data Applications and Services[OL].http://www.opendataresearch.org/content/2014/731/understanding-impacts-kenya-open-data-applications-and-services.html,2020-11-11.
[5]Gonzalezzapata F,Heeks R.The Multiple Meanings of Open Government Data:Understanding Different Stakeholders and Their Perspectives[J].Government Information Quarterly,2015,32(4):441-452.
[6]Van Schalkwyk F,Willmers M,Mcnaughton M.Viscous Open Data:The Roles of Intermediaries in an Open Data Ecosystem[J].Information Technology for Development,2016,22:68-83.
[7]Kassen M.Open Data and Its Institutional Ecosystems:A Comparative Cross-jurisdictional Analysis of Open Data Platforms[J].Canadian Public Administration,2018,61(1):109-129.
[8]Sayogo D,Yuli S B.Critical Success Factors of Open Government and Open Data at Local Government Level in Indonesia[J].International Journal of Electronic Government Research,2018,14:28-43.
[9]Dawes S S,Vidiasova L,Parkhimovich O.Planning and Designing Open Government Data Programs:An Ecosystem Approach[J].Government Information Quarterly,2016,33(1):15-27.
[10]Hellgren D,Nilsson C.Managing Factors that Affect Utilizations of Open Government Data:A Case Study of a Municipality[D].Department of Informatics,2018.
[11]Shkabatur J,Peled A.Sustaining the Open Government Data Movement Worldwide:Insights from Developing Countries[C]//Conference for E-Democracy and Open Government(CeDEM).IEEE,2016:172-179.
[12]Craveiro G,Albano C.Open Data Intermediaries:Coproduction in Budget Transparency[J].Transforming Government:People,Process and Policy,2017,(11):119-131.
[13]Jung K,Park H W.Tracing Interorganizational Information Networks During Emergency Response Period:A Webometric Approach to the 2012 Gumi Chemical Spill in South Korea[J].Government Information Quarterly,2016,33(1):133-141.
[14]Xu W W,Park J Y,Park H W.The Networked Cultural Diffusion of Korean Wave[J].Online Information Review,2015,39(1):43-60.
[15]Fonseca B P F,Fernandes E,Fonseca M V A.Collaboration in Science and Technology Organizations of the Public Sector:A Network Perspective[J].Science and Public Policy,2016,44(1):37-49.
[16]Van Schalkwyk F.Notes on Open Data Ecosystems[OL].http://www.opendataresearch.org/content/2014/719/notes-open-data-ecosystems,2020-11-11. [17]Maximilian H,Fredric S,Tom H.From Toddler to Teen:Growth of an Open Data Ecosystem[J].JeDEM-eJournal of eDemocracy and Open Government,2014,6(2).
[18]Harrison T M,Pardo T A,Cook M.Creating Open Government Ecosystems:A Research and Development Agenda[J].Future Internet,2012,4(4):900-928.
[19]Gupta A,Panagiotopoulos P,Bowen F.An Orchestration Approach to Smart City Data Ecosystems[J].Technological Forecasting and Social Change,2020,153:119929.
[20]Przeybilovicz E,Cunha M A.Open Government Data Programs:The Political System Matters?Revisiting the Dawes Ecosystem Model[C]//Proceedings of the 19th Annual International Conference on Digital Government Research:Governance in the Data Age.New York,NY,USA:ACM,2018:113.
[21]Oliveira M I S,Lóscio B F.What is a Data Ecosystem?[C]//Proceedings of the 19th Annual International Conference on Digital Government Research:Governance in the Data Age.New York,NY,USA:ACM,2018:74:1-74:9.
[22]Lnenicka M,Komarkova J.Big and Open Linked Data Analytics Ecosystem:Theoretical Background and Essential Elements[J].Government Information Quarterly,2019,36(1):129-144.
[23]Welle Donker F,Van Loenen B.How to Assess the Success of the Open Data Ecosystem?[J].International Journal of Digital Earth,2017,10(3):284-306.
[24]Freeman R E.Freeman Strategic Management:A Stakeholder Approach[M].Boston:Pitman,1984.
[25]Bryson J M.What to Do When Stakeholders Matter[J].Public Management Review,2004,6(1):21-53.
[26]Lee D.Building an Open Data Ecosystem-An Irish Experience[J].ACM International Conference Proceeding Series,2014:351-360.
[27]Attard J,Orlandi F,Auer S.Data Value Networks:Enabling a New Data Ecosystem[C]//IEEE/WIC/ACM International Conference on Web Intelligence(WI),2016:453-456.
[28]Jetzek T.Innovation in the Open Data Ecosystem:Exploring the Role of Real Options Thinking and Multi-sided Platforms for Sustainable Value Generation through Open Data[M].Carayannis E G,Sindakis S.Analytics,Innovation,and Excellence-Driven Enterprise Sustainability.New York:Palgrave Macmillan US,2017:137-168.
[29]Robinson P J,Johnson P A.Civic Hackathons:New Terrain for Local Government-Citizen Interaction?[J].Urban Planning,2016,1(2):65.
[30]Almind T C,Ingwersen P.Informetric Analyses on the World Wide Web:Methodological Approaches to‘Webometrics’[J].Journal of Documentation,1997,53(4):404-426.
[31]鮑玉芳,马建霞.科学论文被引频次预测的现状分析与研究[J].情报杂志,2015,34(5):66-71. [32]趙丹群.网络信息计量学研究与发展评述[J].情报理论与实践,2019,42(6):154-158,143.
[33]Park H W,Yoon J,Leydesdorff L.The Normalization of Co-authorship Networks in the Bibliometric Evaluation:The Government Stimulation Programs of China and Korea[J].Scientometrics,2016,109(2):1017-1036.
[34]Shapiro M A,Park H W.Climate Change and Youtube:Deliberation Potential in Post-video Discussions[J].Environmental Communication,2018,12(1):115-131.
[35]Mas-Bleda A,Thelwall M,Kousha K,et al.Do Highly Cited Researchers Successfully Use the Social web?[J].Scientometrics,2014,101(1):337-356.
[36]Lutz C,Hoffmann C P.Making Academic Social Capital Visible:Relating SNS-Based,Alternative and Traditional Metrics of Scientific Impact[J].Social Science Computer Review,2018:0894439317721181.
[37]郭道胜,匡婷婷.网络计量学国内研究的发展轨迹分析[J].情报探索,2018,(12):121-127.
[38]Kim J H,Park H W.Food Policy in Cyberspace:A Webometric Analysis of National Food Clusters in South Korea[J].Government Information Quarterly,2014,31(3):443-453.
[39]吴爱芝.信息技术进步与文献计量学发展[J].现代情报,2016,36(2):32-37.
[40]Ortega L,Ordua-Malea E,Aguillo F I.Are Web Mentions Accurate Substitutes for Inlinks for Spanish Universities?[J].Online Information Review,2014,(1):59-77.
[41]Thelwall M,Sud P,Wilkinson D.Link and Co-inlink Network Diagrams with URL Citations or Title Mentions[J].Journal of the American Society for Information Science and Technology,2012,63(4):805-816.
[42]Thelwall M,Sud P.Webometric Research with the Bing Search API 2.0[J].Journal of Informetrics,2012,6(1):44-52.
[43]国务院.中华人民共和国国务院令第711号:修订后的《中华人民共和国政府信息公开条例》[OL].http://www.gov.cn/zhengce/content/2019-04/15/content_5382991.htm,2019-12-05.
[44]国务院.国务院关于印发促进大数据发展行动纲要的通知[OL].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm,2019-12-05.
[45]中国互联网信息中心.第46次中国互联网络发展状况统计报告[OL].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/202009/P020200929546215182514.pdf,2020-11-11.
[46]Wang F.Understanding the Dynamic Mechanism of Interagency Government Data Sharing[J].Government Information Quarterly,2018,35(4):536-546.
[47]Zhao Y,Fan B.Exploring Open Government Data Capacity of Government Agency:Based on the Resource-based Theory[J].Government Information Quarterly,2018,35(1):1-12.
[48]徐晓林,李海波,马敏.区块链 旅游服务:创新前景与潜在挑战[J].中国行政管理,2019,(4):53-57,78.
[49]张聪丛,郜颍颍,赵畅,等.开放政府数据共享与使用中的隐私保护问题研究——基于开放政府数据生命周期理论[J].电子政务,2018,(9):24-36.
[50]Zhang N,Zhao X,Zhang Z,et al.What Factors Drive Open Innovation in Chinas Public Sector?A Case Study of Official Document Exchange Via Microblogging(ODEM)in Haining[J].Government Information Quarterly,2017,34(1):126-133. [51]Zhou Y,Long Y.SinoGrids:A Practice for Open Urban Data in China[J].Cartography and Geographic Information Science,2016,43(5):379-392.
[52]Wang C,Medaglia R,Zheng L.Towards a Typology of Adaptive Governance in the Digital Government Context:The Role of Decision-making and Accountability[J].Government Information Quarterly,2018,35(2):306-322.
[53]Zhao B.A Privacy Perspective of Open Government:Sex,Wealth,and Transparency in China[C]//Censorship,Surveillance,and Privacy:Concepts,Methodologies,Tools,and Applications.Hershey,PA,USA:IGI Global,2019:1294-1308.
[54]Kharrazi A,Qin H,Zhang Y.Urban Big Data and Sustainable Development Goals:Challenges and Opportunities[M].2016.
[55]万维网基金会.开放数据晴雨表(第4版)[OL].https://opendatabarometer.org/doc/4thEdition/ODB-4thEdition-GlobalReport.pdf,2019-12-05.
[56]张晓娟,孙成,向锦鹏.基于开放数据晴雨表的我国政府数据开放提升路径分析[J].图书情报知识,2017,(6):60-72.
[57]Jalali S M,Park H.Conversations About Open Data on Twitter[J].International Journal of Contents,2017,13:31.
[58]Jung K,Park H W.Citizens Social Media Use and Homeland Security Information Policy:Some Evidences from Twitter Users During the 2013 North Korea Nuclear Test[J].Government Information Quarterly,2014,31(4SI):563-573.
[59]Acharya S,Park H W.Open Data in Nepal:A Webometric Network Analysis[J].Quality and Quantity,2017,51(3SI):1027-1043.
[60]复旦大学数字与移动治理实验室.2018中国开放数林指数(下半年)[OL].http://ifopendata.fudan.edu.cn/static/papers/2018下半年中国开放数林指数.pdf,2019-12-05.
[61]Robinson-Garcia N,Van Leeuwen T N,Ràfols I.Using Altmetrics for Contextualised Mapping of Societal Impact:From Hits to Networks[J].Science and Public Policy,2018,45(6):815-826.
[62]开放知识基金会中国组织.中国大陆开放数据运动时间线[OL].http://timemapper.okfnlabs.org/okfncn/open-data-china-timeline-cn#0,2019-12-05.
[63]开放知识基金会中国组织.2014开放数据日中国区活动[OL].https://planet.okfn.org/category/开放数据日/,2019-12-05.
[64]SODA.上海开放数据创新应用大赛[OL].http://soda.data.sh.gov.cn/reports.html,2019-12-05.
[65]Heilmann S.Policy Experimentation in Chinas Economic Rise[J].Studies in Comparative International Development,2008,43(1):1-26.
[66]Yoon J,Park H W.Triple Helix Dynamics of South Koreas Innovation System:A Network Analysis of Inter-regional Technological Collaborations[J].Quality and Quantity,2017,51(3):989-1007.
[67]Park H W,Kluver R.Trends in Online Networking Among South Korean Politicians—A Mixed-method Approach[J].Government Information Quarterly,2009,26(3):505-515.
[68]Wasserman S,Faust K.Social Network Analysis:Methods and Applications(Structural Analysis in the Social Sciences)[M].Cambridge University Press,1994.
(責任编辑:陈媛)