新型政务数据开放开发模型设计

来源 :现代信息科技 | 被引量 : 0次 | 上传用户:qiaomy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘  要:针对当前政务数据开放共享存在的障碍和问题,文章提出将多方安全计算技术应用到政务数据开放共享领域,设计新型政务数据开放开发模型,从政务数据汇聚共享、开发开放和数据交易市场发展三个方面设计基于多方安全计算的政务数据开发开放解决方案,攻克政务数据开发开放过程中的数据安全和隐私保护问题,实现跨部门数据的融合共享及开发利用,充分发挥政务数据资产的价值。
  关键词:多方安全计算;政务数据开发开放;数据资产目录;数据产品;联合模型
  中图分类号:TP309;TP311.13      文献标识码:A 文章编号:2096-4706(2020)23-0144-03
  A New Design for Opening and Development Model of Government Affair Data
  ——A Multi-Party Secure Computing Design Scheme to Solve the Difficult Problem for Developing and Opening of Government Affair Data
  WU Min
  (Fujian Nebula Big Data Application Service Co.,Ltd.,Fuzhou  350003,China)
  Abstract:In view of the obstacles and problems existing in opening and sharing of government affair data at present,this paper proposes to apply multi-party secure computing technology to the opening and sharing domain of government affair data,designs a new opening and development model of government affair data,and designs an opening and development solution of government affair data based on multi-party secure computing from three aspects of government affair data aggregation and sharing,opening and development,and data trading market development. It solves the problems of data security and privacy protection in the process of opening and development of the government affair data,realizes the integration,sharing,development and utilization of data across multiple departments,and plays fully the value of government affair data assets.
  Keywords:secure multi-party computation;opening and development of government affair data;data asset catalog;data product;joint model
  0  引  言
  2020年4月,中共中央、國务院印发《关于构建更加完善的要素市场化配置体制机制的意见》,首次将数据同土地、劳动力、资本、技术等传统要素并列作为新生产要素,并明确要求“推进政府数据开放共享”。中国80%以上的数据资源掌握在各级政府部门手里,发挥数据的应用价值离不开政府数据的开放共享。政府数据的开放共享程度和数据的开放共享管理机制直接影响到数据利用效果,进而影响社会经济的整体利益最大化。但是当前的政务数据开发开放还停留在初级阶段,出现诸多难题阻碍了政务数据开发开放工作的顺利进行,成为我国实施大数据战略、发展数字经济的最大桎梏。
  1  政务数据开发开放存在的问题
  当前,政务数据开发开放成为电子政务信息化建设的热点,推进政务数据开发开放,是加快培育数据要素市场,推进政府数据开放共享、提升社会数据资源价值、加强数据资源整合和安全保护的重要途径。当前,政务数据开放工作还面临一些问题、存在一些挑战:
  (1)政务数据开发开放缺少数据基础。政府原有的信息管理系统主要是国家的金税、金关、金财、金审、金盾等“金字”信息工程以及各部门自建的信息管理系统,由于组织管理体制的条块化,决定了业务系统的条块化,形成一个一个“信息壁垒”,客观上造成数据共享障碍。
  (2)数据所有权和使用权无法分离。当前,将初级数据挂在政府网站或者直接提供给企业、社会的政务数据共享方式,在企业和社会获得了政务数据使用权的同时也就相当于获得了政务数据的所有权,导致政府难以管控开发开放出去的初级数据的使用范围、用途、用量和有效期,使政务数据的开发开放受到严重制约。
  (3)数据开放技术存在不足。当前在数据处理方面,存在数据格式和质量参差不齐、没有统一的标准等问题,导致数据质量不高、数据分类不清晰、数据更新不及时、数据格式不规范;另外,开放数据平台功能相对简单,数据互操作功能和个性化服务、可视化服务等功能不完善,未能满足使用者需求。   (4)个人隐私保护造成数据不流通。个人数据正在成为一种新的资产,政府机构对其持有的个人数据必须给予充分的保护,以对抗黑客的信息窃取,但隐私政策使得数据在政府部门之间难以流通,政府部门难以利用分散的个人信息来进行分析,提供决策支持。
  因此,目前亟须一个覆盖从政务数据共享到政务数据开发开放,既能保护数据隐私又能实现数据流动起来最大化其价值的解决方案。
  2  多方安全计算技术可行性论证
  多方安全计算(Secure Multi-Party Computation,MPC),
  是一种保护数据安全隐私的多方计算算法,主要解决无可信第三方的情况下,如何安全地计算一个约定函数的问题。在整个计算协议执行过程中,每一个物理隔离的参与方对己方数据始终拥有控制权,数据在不泄露的情况下联合其他各方的数据进行计算并得到明文计算结果,并且参与各方拿到计算结果后也无法推断出其他参与方的原始数据。
  安全多方计算经过多年的发展和研究,技术和应用上都比较成熟。安全多方计算效率已初见成效,行业中涌现了大批的多方安全计算平台,比较出名的有阿里系蚂蚁集团的蚂蚁链摩斯多方安全计算平台、百度系百度安全的MesaTEE安全计算平台等等。
  采用多方安全计算的优势有以下几点:
  (1)保护数据隐私。用户将计算节点部署到本地,多方安全计算平台作为代理,节点间通过代理进行加密通信。各个计算节點在数据和模型不离开本地的前提下,协同进行模型更新和迭代。整个计算过程无私密数据的明文信息或原始数据集的传播。
  (2)打破部门壁垒。公安、人社、医疗等政府部门各自建设的信息化系统在为各部门工作带来便利的同时也形成各行业数据孤岛。多方安全计算使得各部门在保证自身私密信息不泄露的前提下,安全利用跨行业的数据资源,为本部门创造更大的价值。
  (3)模型训练与预测分析。使用MPC技术将多方数据联合在一起,通过MPC预处理保证数据格式统一和数据的隐私性,在多方数据基础上训练出的模型将更加准确,从而对未知情形提供更加合理的预测。
  3  应用于政务数据开发开放的多方安全计算解决方案设计
  福建省星云大数据公司于2020年规划分布式超融合大数据运营总体框架并依据此框架规划了数据资源中心产品,目前产品正在不断研发迭代过程中。笔者在公司主要负责以数据为核心的行业应用规划和顶层设计工作,在分布式超融合大数据运营总体框架规划过程中,提出用多方安全计算框架破解政务数据开发开放难题,并研究设计了应用于政务数据开发开放的多方安全计算解决方案。
  3.1  基于多方安全计算的政务数据汇聚共享体系设计
  政务数据汇聚共享中采用多方安全计算整体解决方案,解决传统的政务数据汇聚共享数据必须“拷贝搬家,数据存储多套”的做法,在确保数据不离开部门的前提下,充分整合数据,实现跨多部门数据的融合共享以及开发利用,实现“1+1>2”的效果。该方案可以有效解决政务数据汇聚共享中的难点,即满足部门数据安全性、敏感性不离部门管辖要求,又能充分整理利用数据价值,并为下一步的政务数据开发开放奠定基础。整体架构模型如图1所示。
  在每个行业部门建设行业数据资源中心,部署行业多方安全计算(MPC)节点,负责对接省级多方安全计算(MPC)枢纽节点,接收枢纽节点发布的模型,执行模型训练任务,形成数据产品反馈给枢纽节点。MPC安全节点还负责对接行业部门业务系统,具备实时从业务系统获取数据的能力,参与模型训练的数据可以实时从相关业务系统获得。
  在省级数据资源中心建设多方安全计算(MPC)枢纽节点,包括数据资产目录、模型发布管理、联合模型训练、数据产品管理、产品绩效管理等方面功能。数据资产目录,负责整合各个行业数据资源中心的数据资源目录,形成省级数据资源目录,省级数据资源目录包括初级数据目录和数据产品目录,在此基础上对初级数据和数据产品进行赋权形成数据资产目录,理清省级政务数据的家底,为下一步的政务数据资产开放目录建设奠定基础。模型发布管理,负责生成并发布数据模型到相关的行业MPC安全节点。联合模型训练,负责整合多个行业MPC模型训练成果,修订参数,完善模型,形成数据产品。数据产品管理,对MPC枢纽节点运行生成数据产品进行赋权、登记、发布等方面的管理。产品绩效管理即对数据产品的应用情况,各个行业MPC贡献情况进行管理,为下一步的数据产品运营收入分成奠定基础。
  3.2  基于多方安全计算的政务数据开发开放体系设计
  政务数据开发开放作为政务数据价值实现的主要方式,应在确保国家利益、公共安全、商业秘密、个人隐私等重要数据安全的前提下,破解公共数据资源开发利用体制机制障碍,主动释放政务数据资源的经济价值和社会价值,释放更多数据红利,有效推动数字经济发展。基于多方安全计算框架可以有效支撑政务数据开发开放,其整体业务逻辑如图2所示。
  省级政务数据开发开放平台部署在互联网上,负责发布开放数据资产目录、开放数据产品管理、模型发布管理、联合模型训练、产品计费管理等功能。开放数据资产目录,列出可以开放的初级数据和数据产品目录,根据“政务数据可用不可见”的要求,可以开放的初级数据也不允许以数据的形式直接提供给企业,需要加工成数据产品后方可提供。开放数据产品管理,对MPC开放节点运行生成数据产品进行赋权、登记、发布等方面的管理。模型发布管理,企业可以在MPC开发开放节点上研发、测试和发布数据分析模型。
  企业根据MPC开发开放节点上的开放数据资产目录结合MPC企业节点的企业数据资产目录设计数据分析模型,并将数据分析模型在MPC开发开放节点上开发、部署和发布。MPC开发开放节点将发布的数据分析模型分别发往MPC枢纽节点和MPC企业节点。MPC枢纽节点和MPC企业节点收到模型后,根据模型匹配自身数据进行训练,将训练所得参数提交到MPC开发开放节点。MPC开发开放节点将两方(也可以是多方)的参数进行联合训练,输出训练结果,形成数据产品,提供给企业。企业可以根据输出的数据产品开展经营活动。   3.3  基于多方安全计算的数据开发开放市场发展模式设计
  采用多方安全计算框架(MPC)进行政府、企业多方数据融合分析挖掘的过程中,能确保政務数据不出政务网,企业数据不出企业的数据资源中心,物理上隔离了参与方的初级数据的传递,为数据使用的数据确权问题奠定技术基础,使数据的所有权和使用权可以实现分离,从而具备了将政务数据作为一种重要资产在数据市场上进行交易的条件,也为政务数据开发开放铺平了道路。基于MPC开放开发节点,政府部门可以规定开放政务数据的用途、用量、有效期等使用属性,企业在拿到MPC输出的数据产品后只能在授权范围内合理地使用数据,并能够将数据产品的使用权再次转让给第三人。多方安全计算框架(MPC)应用于政务数据开发开放上将极大提升政务数据开发开放的水平,将政务数据开发、开放、交易的本质由数据所有权转移转向数据使用权授权,重构政务数据交易模式,从而有效遏制初级政务数据泄漏,降低政务数据泄漏引起的数据流通风险。
  4  结  论
  发展数字经济要加快推进政务数据资产化,政务数据资产化、资本化是数字经济发展的必然趋势,数据财政将成为驱动政府开发政务数据资源主要力量。采用多方安全计算框架(MPC)可以加快推进政务数据资产化,推动建立数据的产权规则和数据要素市场体系,方便政务数据资源进行确权、定价,妥善解决政务数据开发开放过程中的难题,快速建设政务数据开发开放体系。
  参考文献:
  [1] 新华社.中共中央  国务院关于构建更加完善的要素市场化配置体制机制的意见 [J].中华人民共和国国务院公报,2020(11):5-8.
  [2] 孟显印,杨超.我国开放政府数据应用开发的现状与问题 ——基于开放政府数据平台的分析 [J].情报杂志,2020,39(3):163-171+197.
  [3] 王婷.安全多方计算理论研究综述 [J].信息安全与技术,2014,5(5):41-44.
  [4] 苏冠通,徐茂桐.安全多方计算技术与应用综述 [J].信息通信技术与政策,2019(5):19-22.
  [5] 邵晓红.政府数据开放的概念辨析、公共价值和先进实践 [J].通信与信息技术,2020(3):76-78.
  作者简介:吴敏(1985—),女,汉族,福建宁德人,中级工程师,本科,研究方向:政府信息化顶层规划与信息系统设计。
其他文献
摘 要:依據人工智能发展态势下的职业就业需求,文章立足高职机电类专业,通过探索实践提出了适应人工智能发展需求的创客型工匠培养目标,围绕培养目标通过实证提出了相应的培养模式,具体以汽车检测与维修技术专业实践为例,通过开发运用VrCar云平台、学银在线课程平台,配合校内外实践巩固,基于线上线下结合、虚实结合,系统阐述了模式建构、实施及成效。  关键词:人工智能;高职;机电;创客型工匠;实践探索  中图
期刊
摘 要:文章通过对机电专业和电气自动化专业学生的三维学情进行研究分析后,实施了“线上和线下混合式教学+任务闯关驱动+理实虚一体”三位一体的教学策略,报告了以行动导向教学法创新构建的“六环五步”教学模式的实施现状,并对该教学模式实施的效果进行了调查,为工科专业实现德技并修的创新型技术技能人才的培养目标提供了参考。  关键词:线上和线下混合式教学;教学模式;创新型技术技能人才  中图分类号:G434
期刊
摘 要:个人站长是目前大学生创业的主流方法,使用站长工具是网站运营的必备技能。文章着重探讨了站长工具平台——“搜一搜”的建设,在分析市面上已有站长工具缺点的基础上,对“搜一搜”平台进行了具体的系统分析,最终设计并建立了一个更加适合高校学生使用的新平台,旨在为新站长们节约学习成本,提供清晰的运营流程,明确适合个人网站的优化方向,助力大学生创业。  关键词:站长工具;Elasticsearch;关键词
期刊
摘 要:通过分析虚拟现实技术在建筑漫游中的应用,探讨了沉浸式建筑漫游与交互设计制作过程,并以武汉中共五大会址纪念馆为实景开发虚拟漫游交互系统,通过添加人机交互碰撞检测和HTC Vive头戴显示设备,借助操控手柄实现沉浸式建筑漫游和交互系统。体验结果表明,全方位的沉浸式漫游使体验者与建筑的互动性更加强烈,心理上更加亲近,人与建筑关系更为融合。  关键词:中共五大会址;建筑漫游;虚拟漫游;交互设计  
期刊
摘 要:文章以1991—2020年图书馆、情报与文献学领域的国家社会科学基金项目为研究对象,利用CiteSpace软件,通过知识图谱的方式对项目年度分布、类型分布、项目研究主题等特征进行可视化分析,揭示国内图书馆、情报与文献学领域的研究热点和演变情况,结果表明研究主要集中在图书馆理论与实践、知识管理、信息资源管理等领域。文章旨在对图书馆、情报与文献学研究有一个系统、全面的认识与把握,为相关人员了解
期刊
摘 要:文章主要阐述了一种在电信运营商业务代理系统上实现广告管理平台部署的方法,包括電信运营商业务的代理终端和广播电视、车载传媒发布文字广告或者视频广告的广告信息发布系统。在代理终端办理业务的同时,增加广告信息的发布,有利于运营商对于一些优惠政策或者品牌形象的宣传。同时广告信息通过广告信息发布系统的各模块在代理终端进行更新,能够实时变更代理终端的广告信息,按实际需要实施不同的广告策略。  关键词:
期刊
摘 要:现阶段随着5G和物联网技术的发展,万物互联的时代即将到来,由于IPv4网络地址紧缺,IPv6网络逐步替代IPv4网络是时代所趋。文章对IPv6网络相关技术进行了研究和实践,并从绍兴职业技术学院IPv4/IPv6共存的网络建设技术方案出发,从IPv6升级改造技术选型、网络拓扑结构设计、IPv6网络地址规划、IPv6网络路由设计、应用业务改造这几个方面提出了高校IPv6改造思路和技术解决方案。
期刊
摘 要:“1+X”证书制度是职业教育的重大改革举措,是职业教育改革的创新点,以北京信息职业技术学院“虚拟化技术”课程为例,围绕“1+X”证书制度的标准,利用信息化手段,从课程标准、课程内容、课程资源等方面探讨了基于“1+X”证书制度下混合教学模式的实施。“1+X”证书制度对职业院校培养学生的实践能力、提高学生的专业技能、增强学生就业的核心竞争力具有重大意义。  关键词:“1+X”证书制度;“虚拟化
期刊
摘 要:当前社会进入信息化时代,智能化校园的建设已成为高校关注的重点。针对目前高校学生和教职工在日常学习生活中遇到水电门窗等维修事件,开发了一款基于微信小程序的高校后勤报修系统,解决纸质信息传递不及时的问题,尽可能避免因维修不及时导致的人员事故和伤亡。该系统微信端采用JS语言开发,数据库使用MySQL,后台服务端采用Java语言开发。  关键词:智能化校园;微信小程序;后勤报修  中图分类号:TP
期刊
摘 要:模型驱动架构是一个抽象的理论框架,要使其真正落地实践,必须结合项目实际构建一个可行的模型序列,并给出一套模型转换规则。在某大型央企的业务中台项目对该模型序列进行了研究,并总结出一套模型转换规则,即业务过程模型(业务流程模型、业务用例模型)、业务对象模型、领域模型、组件模型、数据模型(概念模型、逻辑模型、物理模型)的组成的模型序列。  关键词:模型驱动架构;业务过程建模;用例模型;领域模型;
期刊