论文部分内容阅读
【摘 要】数字环境下数据已成为发展的主体,数据开放研究是当前研究的热点之一,本文主要针对科研数据开放服务展开研究,图书馆作为信息资源重要收藏和服务机构,科研数据开放服务是其新的发展方向,从数据获取、整理、分析、使用、数据保护等方面研究数据开放可行性,并构建以图书馆为主体参与的科研数据开放服务新模式。
【关键词】数据开放;科研数据开放
引言
数字环境下,数据就是生产力,推动各界飞速发展,科研不再只是对于成果的需求,已经深入到对于研究过程研究数据的需求。不同主体不同视角下的数据会被挖掘出不同价值,封闭式创新正走向开放式创新。但是受限于以期刊论文为典型的研究成果展现形式,作为研究支撑证据的数据不得不被精简省略,海量数据被忽略甚至流失。加上权益限制,科研数据分散于个体或组织内部,形成数据孤岛。这就造成数据浪费,价值被埋没。如何建立数据孤岛间的联系网,防止一次性数据发生,提高数据利用率及价值,使得各方科研数据变得可获取、可重用,数据开放共享迫在眉睫,数据开放服务的出现也成为必然。
1.数据生命周期
我们科研发展的方方面面与数据密切相连,产生数据并利用数据。数据如同资产产品一样有其一定的生命周期。了解数据的生命周期是管理数据的前提。
数据生命周期理论:
什么是数据生命周期,简单的说即是数据整个的流动过程,一般指的是从产生到利用到消除。数据生命周期具体到不同类别的数据又会经历不同的生命周期。一般数据生命周期包含以下几个阶段。
(1)数据生成期:数据生成一直都在进行中,如果没有人为干预或者事先设计好数据生成规则任务等,数据生成将难以控制,从而生成的数据质量和数量都将失控,数据安全性将无法保障。数据生成规则应包含生成人、生成时间、生成地点、生成方式几大因素。
(2)数据运行期:生成后的数据将被用于查询、应用、复制、分析、验证等,但不是所有的数据都会经历运行期,有些数据不被运行直接步入下一阶段,例如日志数据。
(3)数据衰弱期:数据运行一定时间后,价值发挥殆尽,如果没有新的价值被发现挖掘,将步入衰弱期。
(4)数据销毁期:当数据进入衰弱期不再被发现、更新利用,为了数据的安全性和隐私性将被永久性销毁。
2.科研数据生命周期
数字环境下数据在科研中的地位越来越重要,科研数据参与科研的整个过程,经过收集分析整理可以用于生成结果、支持决策、验证成果等。科研数据的产生都是经过科学研究者精心设计获取的价值较大的数据,而目前科研数据已经不再局限于一个科研项目或专职于一個领域的研究,科研数据价值再开发重复再利用才是对科研工作者的尊重。所以,科研数据开放共享是数字环境下发展的共同需求,科研数据生命周期具有丰富性和动态化特征。笔者认为科研数据生命周期包含以下几个阶段,如图1所示:
科研数据设计采集期:根据科研工作者需求制定一定的采集规则,收集新的数据或者对原有数据进行更新。
科研数据处理分析期:针对收集到的数据进行存储、整理、分类、组合、分析等,从中提取有价值信息,进行二次加工,从而形成支持研究的情报。
科研数据运行使用期:数据运行使用有一定的曲线波动,情报数据产生后,在研究热点期使用波动强度较大,随着研究热点改变转移,数据使用波动会减弱。
科研数据安全保护期:数据是资产的话,那么科研数据就是流动资产,相较于其他数据来说科研数据的使用价值更大,更新速度更快,更需要安全性保障。
科研数据归档销毁期:科研数据是可以更新循环使用的,所以对于活动衰弱但是有潜在价值的科研数据的归档保存,安全维护是很重要的。而对于零价值科研数据的销毁也是必要的。
3.科研数据开放共享服务
数字环境下,科学研究已经进入了数据驱动时代,数据将推动科研飞速发展。不同主体不同视角对于数据的分析使用将迸发出不同的新鲜主题及成果,数据开放共享融合使用将成为必然也是当前科研迫切需要。
3.1科研数据开放共享的意义
科研方法从早期的实验科学、理论科学、计算科学发展到现在的数据密集型科学,以数据为中心的科研探索成为主流科研手段。读者对于科研成果需求也从早期了解科研结论发展到现在对于研究过程研究数据的了解需求。从采集获取数据来思考研究方向,科研创新也是更多依赖于海量数据的分析整理。数据不仅是为科研提供有力支撑,也是科研成果的重要组成部分。
早期阶段数据开放研究更多指向的是政府公共数据开放,开放的是数据本身承载的知情权属性,政府公共数据是所有人的劳动成果,为了更好的服务社会理应开放。目前阶段数据开放研究指向的是开放数据的使用权,把数据所有权归还给研究者本人,他们有权进行研究成果分享交流,也有权对研究数据进行互通有无,那么研究数据不再只是研究成果的支撑,也会变成检验研究成果的证据。通过数据开放为科研思想提供新的内容,进而推动其多方向发展创新。
3.2科研数据开放共享服务
通过对数据生命周期各阶段的理解认识,根据科研数据的实际特征,联想出科研数据生命周期几大阶段。基于科研数据生命周期设计科研数据开放共享服务几大模块。
①科研数据开放采集模块。科研数据开放,是为科研工作者提供一个自由交流数据的开放平台,从科研成果发表开始,可以以单位或者以专业为主体进行采集,明确主体责任,明确采集规则程序,通过数据使用价值曲线波动情况分析采集不同类别数据。
②科研数据开放整理模块。对采集到的科研数据进行加工、整理、分类、汇交、组合、分析等过程,建立分类检索导航,可以以专业或研究方向划分,也可以按照数据发挥作用划分比如验证型数据、支持决策数据、结果证明数据、元数据、二次数据、过程数据等等;可以挖掘不同数据的共同价值聚合整理;可以把同一数据分析出不同价值;在数据整理模块需要投入更高的分析技术和专业型人才。 ③科研数据开放安全保护模块。科研数据开放共享并不是完全无条件的,所有的自由都是相对而言的,科研数据相较于一般数据来说更具有使用研究价值也更具隐私保密性,需要较好的安全维护。针对科研数据的安全,可以对其进行权限划分,比如一般的过程数据、网络公共数据、显性数据可以开放自由使用,而一些具有专业加工性质的科研数据,所有者可以要求使用权限设置,科研工作者通过注册申请平台,可以上传自己的科研数据,并设置权限属性,也可以提出共享需求对高级权限科研数据进行交互分享,当然科研数据开放共享不仅仅是下载使用,还为用户提供科研数据成果交流二次创造平台。做好科研数据安全保护是尤为重要的一个环节。
④科研数据开放使用模块。科研数据开放使用,提供科研数据存储、科研数据上传、科研数据查询、科研数据下载、科研数据需求申请、科研数据复制、科研数据更新等服务,用户可以根据自己的需求情况进行使用。
⑤科研数据开放归档销毁模块。科研数据流动性时效性是非常强的,每个数据都有自己的活动曲线,曲线的趋势紧跟科研数据的使用价值发挥情况,而科研数据的使用价值又与科研热点息息相关,尽可能的通过分类分析加工组合等手段挖掘科研数据的显性隐性价值是科研数据开放共享平台的服务宗旨,对于有潜在价值的科研数据进行归档留存,而对于价值衰退的科研数据为了保密和隐私进行销毁也是必要程序。
除了以上五大模块,从建立数据采集获取模块,进而对这些数据进行整理分类分析建立可供检索的数据分类导航模块。并构想科研数据保护规则,区分隐私保护、授权共享、无限制开放及使用条件设置,最后安全储存销毁科研数据,科研数据开放共享平台还可以为用户提供交流反馈建议,以期更好地为科研服务。
4.结语
科研数据是科研工作者努力的结晶,被科研工作者看做私人财产,大部分科研工作者对于科研数据开放共享还有一定的不舍情绪,会存在胜利果实被窃取的感觉。但是,越来越多的科研工作者发现科研数据存在重复、老化、费时费力费钱等问题,甚至有些科研过程完全没有必要,造成各种成本的浪费,数据孤岛现象依然存在。如何让科研数据重复利用起来,如何打破数据孤岛现象,如何更好的发挥科研数据应有的价值,科研小圈子中已经有科研工作者通过努力和不同方式尝试对于科研数据进行了开放共享,这种观念的转变将促进科研工作者踊跃参与开放共享科研数据中来,也更能推动各种科研数据开放共享平台的建设发展。科研数据开放共享服务将成为现在乃至未来科研界必备服务。
参考文献
[1]刘金亚,顾立平,张潇月,陈新兰. 开放科研数据环境下科研人员的数据伦理框架研究[J]. 情报理论与实践,,:1-10.
[2]刘桂锋,张裕,苏文成,宋新平. 高校科研数据平台功能定位与优化研究——基于眼动追踪实验[J]. 情报理论与实践,,:1-11.
[3]王丹丹,吴思洁. 英国科研数据开放共享的关键问题思考[J]. 情报杂志,2020,39(09):163-167+182.
[4]姜鑫,馬海群,王德庄. 国外科研机构开放科学数据与个人数据保护的政策协同研究——基于爱丁堡大学《数据保护政策》的案例分析[J]. 档案学研究,2020,(04):135-143.
[5]顾立平,陈新兰,张潇月,刘金亚. 开放科研数据中的数据价值提升策略[J]. 图书馆论坛,2020,40(09):115-124.
基金项目:北华航天工业学院科研基金项目;项目编号:KY-2020-36
项目名称:数字环境下科研数据开放共享服务研究
作者简介:杨园利(1987.09-),女,河北廊坊人,硕士研究生,馆员,研究方向为竞争情报、信息管理。
【关键词】数据开放;科研数据开放
引言
数字环境下,数据就是生产力,推动各界飞速发展,科研不再只是对于成果的需求,已经深入到对于研究过程研究数据的需求。不同主体不同视角下的数据会被挖掘出不同价值,封闭式创新正走向开放式创新。但是受限于以期刊论文为典型的研究成果展现形式,作为研究支撑证据的数据不得不被精简省略,海量数据被忽略甚至流失。加上权益限制,科研数据分散于个体或组织内部,形成数据孤岛。这就造成数据浪费,价值被埋没。如何建立数据孤岛间的联系网,防止一次性数据发生,提高数据利用率及价值,使得各方科研数据变得可获取、可重用,数据开放共享迫在眉睫,数据开放服务的出现也成为必然。
1.数据生命周期
我们科研发展的方方面面与数据密切相连,产生数据并利用数据。数据如同资产产品一样有其一定的生命周期。了解数据的生命周期是管理数据的前提。
数据生命周期理论:
什么是数据生命周期,简单的说即是数据整个的流动过程,一般指的是从产生到利用到消除。数据生命周期具体到不同类别的数据又会经历不同的生命周期。一般数据生命周期包含以下几个阶段。
(1)数据生成期:数据生成一直都在进行中,如果没有人为干预或者事先设计好数据生成规则任务等,数据生成将难以控制,从而生成的数据质量和数量都将失控,数据安全性将无法保障。数据生成规则应包含生成人、生成时间、生成地点、生成方式几大因素。
(2)数据运行期:生成后的数据将被用于查询、应用、复制、分析、验证等,但不是所有的数据都会经历运行期,有些数据不被运行直接步入下一阶段,例如日志数据。
(3)数据衰弱期:数据运行一定时间后,价值发挥殆尽,如果没有新的价值被发现挖掘,将步入衰弱期。
(4)数据销毁期:当数据进入衰弱期不再被发现、更新利用,为了数据的安全性和隐私性将被永久性销毁。
2.科研数据生命周期
数字环境下数据在科研中的地位越来越重要,科研数据参与科研的整个过程,经过收集分析整理可以用于生成结果、支持决策、验证成果等。科研数据的产生都是经过科学研究者精心设计获取的价值较大的数据,而目前科研数据已经不再局限于一个科研项目或专职于一個领域的研究,科研数据价值再开发重复再利用才是对科研工作者的尊重。所以,科研数据开放共享是数字环境下发展的共同需求,科研数据生命周期具有丰富性和动态化特征。笔者认为科研数据生命周期包含以下几个阶段,如图1所示:
科研数据设计采集期:根据科研工作者需求制定一定的采集规则,收集新的数据或者对原有数据进行更新。
科研数据处理分析期:针对收集到的数据进行存储、整理、分类、组合、分析等,从中提取有价值信息,进行二次加工,从而形成支持研究的情报。
科研数据运行使用期:数据运行使用有一定的曲线波动,情报数据产生后,在研究热点期使用波动强度较大,随着研究热点改变转移,数据使用波动会减弱。
科研数据安全保护期:数据是资产的话,那么科研数据就是流动资产,相较于其他数据来说科研数据的使用价值更大,更新速度更快,更需要安全性保障。
科研数据归档销毁期:科研数据是可以更新循环使用的,所以对于活动衰弱但是有潜在价值的科研数据的归档保存,安全维护是很重要的。而对于零价值科研数据的销毁也是必要的。
3.科研数据开放共享服务
数字环境下,科学研究已经进入了数据驱动时代,数据将推动科研飞速发展。不同主体不同视角对于数据的分析使用将迸发出不同的新鲜主题及成果,数据开放共享融合使用将成为必然也是当前科研迫切需要。
3.1科研数据开放共享的意义
科研方法从早期的实验科学、理论科学、计算科学发展到现在的数据密集型科学,以数据为中心的科研探索成为主流科研手段。读者对于科研成果需求也从早期了解科研结论发展到现在对于研究过程研究数据的了解需求。从采集获取数据来思考研究方向,科研创新也是更多依赖于海量数据的分析整理。数据不仅是为科研提供有力支撑,也是科研成果的重要组成部分。
早期阶段数据开放研究更多指向的是政府公共数据开放,开放的是数据本身承载的知情权属性,政府公共数据是所有人的劳动成果,为了更好的服务社会理应开放。目前阶段数据开放研究指向的是开放数据的使用权,把数据所有权归还给研究者本人,他们有权进行研究成果分享交流,也有权对研究数据进行互通有无,那么研究数据不再只是研究成果的支撑,也会变成检验研究成果的证据。通过数据开放为科研思想提供新的内容,进而推动其多方向发展创新。
3.2科研数据开放共享服务
通过对数据生命周期各阶段的理解认识,根据科研数据的实际特征,联想出科研数据生命周期几大阶段。基于科研数据生命周期设计科研数据开放共享服务几大模块。
①科研数据开放采集模块。科研数据开放,是为科研工作者提供一个自由交流数据的开放平台,从科研成果发表开始,可以以单位或者以专业为主体进行采集,明确主体责任,明确采集规则程序,通过数据使用价值曲线波动情况分析采集不同类别数据。
②科研数据开放整理模块。对采集到的科研数据进行加工、整理、分类、汇交、组合、分析等过程,建立分类检索导航,可以以专业或研究方向划分,也可以按照数据发挥作用划分比如验证型数据、支持决策数据、结果证明数据、元数据、二次数据、过程数据等等;可以挖掘不同数据的共同价值聚合整理;可以把同一数据分析出不同价值;在数据整理模块需要投入更高的分析技术和专业型人才。 ③科研数据开放安全保护模块。科研数据开放共享并不是完全无条件的,所有的自由都是相对而言的,科研数据相较于一般数据来说更具有使用研究价值也更具隐私保密性,需要较好的安全维护。针对科研数据的安全,可以对其进行权限划分,比如一般的过程数据、网络公共数据、显性数据可以开放自由使用,而一些具有专业加工性质的科研数据,所有者可以要求使用权限设置,科研工作者通过注册申请平台,可以上传自己的科研数据,并设置权限属性,也可以提出共享需求对高级权限科研数据进行交互分享,当然科研数据开放共享不仅仅是下载使用,还为用户提供科研数据成果交流二次创造平台。做好科研数据安全保护是尤为重要的一个环节。
④科研数据开放使用模块。科研数据开放使用,提供科研数据存储、科研数据上传、科研数据查询、科研数据下载、科研数据需求申请、科研数据复制、科研数据更新等服务,用户可以根据自己的需求情况进行使用。
⑤科研数据开放归档销毁模块。科研数据流动性时效性是非常强的,每个数据都有自己的活动曲线,曲线的趋势紧跟科研数据的使用价值发挥情况,而科研数据的使用价值又与科研热点息息相关,尽可能的通过分类分析加工组合等手段挖掘科研数据的显性隐性价值是科研数据开放共享平台的服务宗旨,对于有潜在价值的科研数据进行归档留存,而对于价值衰退的科研数据为了保密和隐私进行销毁也是必要程序。
除了以上五大模块,从建立数据采集获取模块,进而对这些数据进行整理分类分析建立可供检索的数据分类导航模块。并构想科研数据保护规则,区分隐私保护、授权共享、无限制开放及使用条件设置,最后安全储存销毁科研数据,科研数据开放共享平台还可以为用户提供交流反馈建议,以期更好地为科研服务。
4.结语
科研数据是科研工作者努力的结晶,被科研工作者看做私人财产,大部分科研工作者对于科研数据开放共享还有一定的不舍情绪,会存在胜利果实被窃取的感觉。但是,越来越多的科研工作者发现科研数据存在重复、老化、费时费力费钱等问题,甚至有些科研过程完全没有必要,造成各种成本的浪费,数据孤岛现象依然存在。如何让科研数据重复利用起来,如何打破数据孤岛现象,如何更好的发挥科研数据应有的价值,科研小圈子中已经有科研工作者通过努力和不同方式尝试对于科研数据进行了开放共享,这种观念的转变将促进科研工作者踊跃参与开放共享科研数据中来,也更能推动各种科研数据开放共享平台的建设发展。科研数据开放共享服务将成为现在乃至未来科研界必备服务。
参考文献
[1]刘金亚,顾立平,张潇月,陈新兰. 开放科研数据环境下科研人员的数据伦理框架研究[J]. 情报理论与实践,,:1-10.
[2]刘桂锋,张裕,苏文成,宋新平. 高校科研数据平台功能定位与优化研究——基于眼动追踪实验[J]. 情报理论与实践,,:1-11.
[3]王丹丹,吴思洁. 英国科研数据开放共享的关键问题思考[J]. 情报杂志,2020,39(09):163-167+182.
[4]姜鑫,馬海群,王德庄. 国外科研机构开放科学数据与个人数据保护的政策协同研究——基于爱丁堡大学《数据保护政策》的案例分析[J]. 档案学研究,2020,(04):135-143.
[5]顾立平,陈新兰,张潇月,刘金亚. 开放科研数据中的数据价值提升策略[J]. 图书馆论坛,2020,40(09):115-124.
基金项目:北华航天工业学院科研基金项目;项目编号:KY-2020-36
项目名称:数字环境下科研数据开放共享服务研究
作者简介:杨园利(1987.09-),女,河北廊坊人,硕士研究生,馆员,研究方向为竞争情报、信息管理。