论文部分内容阅读
摘要:档案大数据是档案信息化过程中的必然产物,同时也是大数据时代档案服务工作所面临的新的格局。档案资源形态的变化会引起档案服务方式的变革,这既是档案服务工作的机遇,同时也是一种挑战。在对档案大数据内涵及特点充分认识的提前下,提出有针对性的档案馆服务创新策略可以有效的提升服务效率和服务质量,为档案服务改革发展助力。
关键词:大数据;档案馆;服务创新
引言
在信息化不断深入的背景下,档案信息呈现爆炸式的增长速度,并且广泛的存在于政府部门、企事业单位等不同类型的社会主体中。随着信息技术的发展,档案信息的产生及保存形式多呈现非结构化和半结构化的状态,档案数字化的不断深入也促进档案资源形态的变化,档案大数据时代即将到来。需要注意的是,档案资源已经成为一种重要的数据资产,其意义不在于占有多大的数据量,而在于其中所包含的可被开发和利用的信息量,因此应该提升档案馆服务能力,使档案能够更好的发挥其应有的作用。
1.档案大数据简介
目前,学界对“档案大数据”的定义仍没有定论,大多数学者在大数据定义与特征的基础上进行探讨阐释。有人强调档案大数据的体量巨大,用目前主流软件工具在合理时间内无法从中获取信息;有人认为档案大数据特指檔案中的大数据,是档案数据的集合;有人指出档案大数据是在档案业务活动中形成的与档案相关的数据集;也有人从大档案观、知识挖掘、思维方法与管理模式等方面来强调档案大数据与大数据联系之密切。从不同角度理解,几位学者的观点都有其合理性。从理论探讨和实践尝试两方面来看,档案大数据在生成、管理、开发和利用等方面已经具有大数据的一些基本特性,但其本质仍然是具有原始记录性的档案。档案大数据更像是档案信息化过程中自然产生的一种现象或档案工作发展的新样态,在这一现象发展成熟之前,各界尚无法对其定义进行明确界定。但可以看出,档案大数据的核心内容是档案资源,以大规模数据集形式存在,必须借助先进的信息技术手段进行科学管理、智能开发与开放共享式服务,才能充分挖掘数据资源的内涵,发挥潜在的无限价值。
2.档案大数据的特点
2.1数据体量巨大
社会各领域存量档案数字化工作持续推进,各类业务系统产生的档案数据快速累积,加之产生于官方网站、社交媒体等网络平台的档案数据资源也陆续被纳入归档范围,档案部门积累的档案数据规模越来越大,数据集总量甚至能够达到PB甚至EB级别。
2.2数据类型复杂
在网络化环境中,基于各类业务系统与网络平台产生的半结构化与非结构化数据逐渐占
据主流,特别是社交媒体在生活中的广泛应用使得照片、音视频等数据占据了较大比重,档案大数据类型必然呈现出更加多样化和复杂性的特点。
2.3数据价值密度高
档案数据是具有较高完整性、真实性与准确性的数据,其价值不会随着数据规模的扩张而降低,这是档案大数据的独特之处。在档案内容开发中重视档案数据的全面性、复杂性与相关性等特征,并在数据关联的基础上进行全数据分析反而会更大程度地提升数据价值,进而开发出更高价值密度的信息和知识产品。
2.4数据兼具动态性与稳定性
档案大数据在数据处理流程上可以实现动态生成与捕获、实时鉴定与存储、自动著录与标引以及智能分析与开放共享,但数据本身的稳定性才能保证其作为档案的证据与凭证功能。实时的数据流需要经过规范处理才能转换成有效的档案数据,如将数据锁定为不可更改的稳定状态。
2.5技术依赖性强
档案大数据的存储、处理与服务 等每一个环节都对信息技术具有强烈的依赖性。以数据驱动技术创新是大数据时代发展的必然趋势。因数据体量大、结构复杂等特点,目前主流软件工具已不能完全满足档案大数据开发与信息服务方面的需求。盘活档案数据资产,创新档案信息服务必将依赖于信息技术的创新与完善。
2.6处理速度快
在信息技术的帮助下,档案数据在生成、流转、检索、分析、查阅、获取等各个处理环节都能在较短的时间内快速完成。在“数据为王”的时代,数据占有量与数据分析处理速度是决定档案大数据开发与信息服务效果的关键因素。
3.大数据环境下档案馆服务创新策略
大数据环境下的服务创新不是单纯的理论问题,也不是单一的对策分析,而是面向用户的知识聚合与服务融合的现实问题。因此,服务创新应逐渐发展为以用户为中心,以信息技术为手段,以知识挖掘为目的,以关联网络为桥梁的信息服务模式。
3.1转变理念
大数据趋势下,信息服务以数据为中心,以数据为驱动的特征越来越明显。档案馆服务创新首先要改变认识,遵循数据为王,以对大数据深度应用及数据价值的深度挖掘为导向,坚持数据驱动而非目标驱动或经验驱动,从数据中发现并满足用户需求,从数据中推动档案馆资源发现,从数据中实现档案馆价值提升。例如,N A R A 通过分析用户对馆藏目录的点击率,选取点击率高的档案进行数字化,进而开展深层次的信息服务,取得了很好的效果。
3.2整合资源
大数据时代,数据的价值从何而来?涂子沛认为,海量是基础,整合是关键。如何将不同数据库打通,实现资源共享,将是大数据价值能否最大化的前提,也是档案馆能否“数据化生存”的关键。一方面,档案部门可借助云计算技术,“打通档案信息社会共享、服务群众的‘最后一节路’,让各级档案馆的已开放档案在更大平台上,供更多人共享,发挥更大作用,推动以服务群众为主导的档案信息化体系的实质性建立”。另一方面,档案部门应加强与图书馆、博物馆及互联网运营商之间的合作,从而实现档案信息服务的证析与互补。
3.3.保证信息安全
大数据是一把双刃剑,社会因大数据而获益匪浅,但个人隐私也将无处遁形。因此,大数据环境下,档案馆除了要从技术上实现反黑客、反病毒、防盗窃等方式来抵御外来入侵者的威胁外,更需要重点加强在信息安全保障体系、信息资源共享制度、机密信息保护、信息审计等方面的制度建设,从管理上杜绝信息安全风险、切实加强个人隐私保护。
3.4加强人才建设
国以才立,政以才兴,业以才立。
从上古的结绳记事到今天的数字化管理,技术的发展对档案馆人员提出了越来越高的要求。大数据时代,档案馆人员要实现从“一把锁”到“数据科学家”的转变。对此,缪其浩认为,未来的数据科学家应具备三大核心技能,“一是具备数学知识为数据集构模,二是具备工程技能建成数据模型分析系统,三是发现见解,从数据中讲出故事来”。也就是说,大数据时代的的数字档案馆信息服务工作需要技术人员和行业专家的共同合作。因此,需要采取灵活的策略来构建大数据时代的人才储备。
4.结语
历史经验证明,每一次重大信息技术的应用,都将会给国家乃至整个社会带来深刻的变革。在过去“信息技术变革的重点在‘T’(技术),而不是在‘I’(信息)上。现在,我们是时候把聚光灯打向‘I’,开始关注信息本身了”, 这个聚光灯就是大数据。对于掌握大量国家和社会重要价值信息的档案馆而言,我们拥有无数的“金子”,却把它像 沙子一样堆在一起,在固守中被网络化的大潮冲得七零八散。大数据时代,档案馆面临着激烈的数据竞争,公民对于“数据权”的获取意识增强,需要加快档案信息资源的开放力度;大数据有利于推动档案信息资源的集成与整合,提升数字档案馆管理与服务能力,促进档案事业发展。
参考文献:
[1]王天泥.知识咨询:大数据时代图书馆的知识服务增长点[J].图书与情报,2013(2):74.
[2]张斌,马费成.大数据环境下数字信息资源服务创新[J].情报理论与实践,2014(6):31.
[3]毛晓燕.大数据环境下图书馆信息服务走向分析,图书馆工作与研究,2014(3):74.
关键词:大数据;档案馆;服务创新
引言
在信息化不断深入的背景下,档案信息呈现爆炸式的增长速度,并且广泛的存在于政府部门、企事业单位等不同类型的社会主体中。随着信息技术的发展,档案信息的产生及保存形式多呈现非结构化和半结构化的状态,档案数字化的不断深入也促进档案资源形态的变化,档案大数据时代即将到来。需要注意的是,档案资源已经成为一种重要的数据资产,其意义不在于占有多大的数据量,而在于其中所包含的可被开发和利用的信息量,因此应该提升档案馆服务能力,使档案能够更好的发挥其应有的作用。
1.档案大数据简介
目前,学界对“档案大数据”的定义仍没有定论,大多数学者在大数据定义与特征的基础上进行探讨阐释。有人强调档案大数据的体量巨大,用目前主流软件工具在合理时间内无法从中获取信息;有人认为档案大数据特指檔案中的大数据,是档案数据的集合;有人指出档案大数据是在档案业务活动中形成的与档案相关的数据集;也有人从大档案观、知识挖掘、思维方法与管理模式等方面来强调档案大数据与大数据联系之密切。从不同角度理解,几位学者的观点都有其合理性。从理论探讨和实践尝试两方面来看,档案大数据在生成、管理、开发和利用等方面已经具有大数据的一些基本特性,但其本质仍然是具有原始记录性的档案。档案大数据更像是档案信息化过程中自然产生的一种现象或档案工作发展的新样态,在这一现象发展成熟之前,各界尚无法对其定义进行明确界定。但可以看出,档案大数据的核心内容是档案资源,以大规模数据集形式存在,必须借助先进的信息技术手段进行科学管理、智能开发与开放共享式服务,才能充分挖掘数据资源的内涵,发挥潜在的无限价值。
2.档案大数据的特点
2.1数据体量巨大
社会各领域存量档案数字化工作持续推进,各类业务系统产生的档案数据快速累积,加之产生于官方网站、社交媒体等网络平台的档案数据资源也陆续被纳入归档范围,档案部门积累的档案数据规模越来越大,数据集总量甚至能够达到PB甚至EB级别。
2.2数据类型复杂
在网络化环境中,基于各类业务系统与网络平台产生的半结构化与非结构化数据逐渐占
据主流,特别是社交媒体在生活中的广泛应用使得照片、音视频等数据占据了较大比重,档案大数据类型必然呈现出更加多样化和复杂性的特点。
2.3数据价值密度高
档案数据是具有较高完整性、真实性与准确性的数据,其价值不会随着数据规模的扩张而降低,这是档案大数据的独特之处。在档案内容开发中重视档案数据的全面性、复杂性与相关性等特征,并在数据关联的基础上进行全数据分析反而会更大程度地提升数据价值,进而开发出更高价值密度的信息和知识产品。
2.4数据兼具动态性与稳定性
档案大数据在数据处理流程上可以实现动态生成与捕获、实时鉴定与存储、自动著录与标引以及智能分析与开放共享,但数据本身的稳定性才能保证其作为档案的证据与凭证功能。实时的数据流需要经过规范处理才能转换成有效的档案数据,如将数据锁定为不可更改的稳定状态。
2.5技术依赖性强
档案大数据的存储、处理与服务 等每一个环节都对信息技术具有强烈的依赖性。以数据驱动技术创新是大数据时代发展的必然趋势。因数据体量大、结构复杂等特点,目前主流软件工具已不能完全满足档案大数据开发与信息服务方面的需求。盘活档案数据资产,创新档案信息服务必将依赖于信息技术的创新与完善。
2.6处理速度快
在信息技术的帮助下,档案数据在生成、流转、检索、分析、查阅、获取等各个处理环节都能在较短的时间内快速完成。在“数据为王”的时代,数据占有量与数据分析处理速度是决定档案大数据开发与信息服务效果的关键因素。
3.大数据环境下档案馆服务创新策略
大数据环境下的服务创新不是单纯的理论问题,也不是单一的对策分析,而是面向用户的知识聚合与服务融合的现实问题。因此,服务创新应逐渐发展为以用户为中心,以信息技术为手段,以知识挖掘为目的,以关联网络为桥梁的信息服务模式。
3.1转变理念
大数据趋势下,信息服务以数据为中心,以数据为驱动的特征越来越明显。档案馆服务创新首先要改变认识,遵循数据为王,以对大数据深度应用及数据价值的深度挖掘为导向,坚持数据驱动而非目标驱动或经验驱动,从数据中发现并满足用户需求,从数据中推动档案馆资源发现,从数据中实现档案馆价值提升。例如,N A R A 通过分析用户对馆藏目录的点击率,选取点击率高的档案进行数字化,进而开展深层次的信息服务,取得了很好的效果。
3.2整合资源
大数据时代,数据的价值从何而来?涂子沛认为,海量是基础,整合是关键。如何将不同数据库打通,实现资源共享,将是大数据价值能否最大化的前提,也是档案馆能否“数据化生存”的关键。一方面,档案部门可借助云计算技术,“打通档案信息社会共享、服务群众的‘最后一节路’,让各级档案馆的已开放档案在更大平台上,供更多人共享,发挥更大作用,推动以服务群众为主导的档案信息化体系的实质性建立”。另一方面,档案部门应加强与图书馆、博物馆及互联网运营商之间的合作,从而实现档案信息服务的证析与互补。
3.3.保证信息安全
大数据是一把双刃剑,社会因大数据而获益匪浅,但个人隐私也将无处遁形。因此,大数据环境下,档案馆除了要从技术上实现反黑客、反病毒、防盗窃等方式来抵御外来入侵者的威胁外,更需要重点加强在信息安全保障体系、信息资源共享制度、机密信息保护、信息审计等方面的制度建设,从管理上杜绝信息安全风险、切实加强个人隐私保护。
3.4加强人才建设
国以才立,政以才兴,业以才立。
从上古的结绳记事到今天的数字化管理,技术的发展对档案馆人员提出了越来越高的要求。大数据时代,档案馆人员要实现从“一把锁”到“数据科学家”的转变。对此,缪其浩认为,未来的数据科学家应具备三大核心技能,“一是具备数学知识为数据集构模,二是具备工程技能建成数据模型分析系统,三是发现见解,从数据中讲出故事来”。也就是说,大数据时代的的数字档案馆信息服务工作需要技术人员和行业专家的共同合作。因此,需要采取灵活的策略来构建大数据时代的人才储备。
4.结语
历史经验证明,每一次重大信息技术的应用,都将会给国家乃至整个社会带来深刻的变革。在过去“信息技术变革的重点在‘T’(技术),而不是在‘I’(信息)上。现在,我们是时候把聚光灯打向‘I’,开始关注信息本身了”, 这个聚光灯就是大数据。对于掌握大量国家和社会重要价值信息的档案馆而言,我们拥有无数的“金子”,却把它像 沙子一样堆在一起,在固守中被网络化的大潮冲得七零八散。大数据时代,档案馆面临着激烈的数据竞争,公民对于“数据权”的获取意识增强,需要加快档案信息资源的开放力度;大数据有利于推动档案信息资源的集成与整合,提升数字档案馆管理与服务能力,促进档案事业发展。
参考文献:
[1]王天泥.知识咨询:大数据时代图书馆的知识服务增长点[J].图书与情报,2013(2):74.
[2]张斌,马费成.大数据环境下数字信息资源服务创新[J].情报理论与实践,2014(6):31.
[3]毛晓燕.大数据环境下图书馆信息服务走向分析,图书馆工作与研究,2014(3):74.