论文部分内容阅读
摘 要:大数据时代的来临给企业数字档案馆建设带来了很大挑战,本文通过对大数据的概念和特征的简单介绍,分析了大数据对企业数字档案馆建设带来的影响,并针对影响提出了相关的应对策略。
关键词:大数据;数字档案馆;知识管理
引言
随着互联网技术的飞速发展,特别是物联网、社交网络和云计算的兴起,全球数据量急剧增长,数据种类也越来越多样化,各种非结构化和半结构化数据大量涌现,数据资源已经成为了当今社会增长最快的资源之一。根据国际数据公司IDC 监测统计,人类产生的数据量正在呈指数级增长,大约每两年翻一番,并且这个速度在一段时间内会继续保持下去。海量、多源异构的数据给企业管理和发展带了很大挑战,在传统的数据存储、分析、挖掘技术难以实时处理大量非结构化信息的情况下,大数据的概念应运而生。
1.大数据的概念与特征
大数据是一个比较抽象的概念,在信息科学领域至今尚无确切、统一的定义,在维基百科中对大数据如此定义:大数据是指利用常用软件工具来获取、管理和处理数据所消耗时间超过可容忍时间的数据集。这是一个模糊性的定义,因为它对常用软件和可容忍时间的范围并未明确界定。研究机构Gartner也对大数据进行了定义:大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量的、高增长率和多样化的信息资产。这是一个描述性的定义,在数据处理的基础上加入此类数据的一些特征,并用这些特征描述大数据。总的来说,尽管各方对大数据的表述不一,但其内涵一致,从本质上来说,大数据主要解决的是海量数据存储、计算、挖掘和展示的问题。
国内外学者经过多年的研究,目前,尽管对大数据的定义尚有分歧但对于大数据的特征已经达成了共识:数据规模大(Volume),数据种类多(Variety),处理速度快(Velocity),数据价值密度低(Value),称之为四“V”特性。
2.大数据对企业数字档案馆建设的影响
由于大数据具有数据量巨大、数据类型繁多、价值密度低和处理速度快的四“V”特点,因此大数据不仅对企业信息化工作带来了新的挑战,也对数字档案馆建设与发展产生了很大的影响。
2.1档案大数据的获取
在信息化高速发展的今天,档案信息资源也呈現出复杂性和多样性的特点,从技术实施的角度来看,档案大数据可以从两个维度来考虑:数据结构类型和实效性。从数据结构类型上分析,要同时支持结构化数据(来源于关系数据库)、半结构化数据(来源于格式化文件如XML)、非结构化数据(电子照片、音频文件和视频文件等)。2019年12月26日,我国最高人民法院公布了《最高人民法院关于修改<关于民事诉讼证据的若干规定>的决定》,该决定第四十条规定,电子数据包括网页、博客、微博客等网络平台发布的信息;手机短信、电子邮件、即时通信、通讯群组等网络应服务的通讯信息都可以作为正式打官司的证据,进一步说明了档案资源的数据类型与获取渠道将日益广泛化。从实效性的维度分析,由于大数据反映的是一种趋势,通过数据量的变化推断出事件发生的概率,数据量越大概率也会越准确,因此单一数据的时效性和价值将会逐渐弱化。
2.2档案大数据的应用
知识管理是档案管理发展的趋势,档案用户已不满足于数据或文件的查询利用,更希望获取数据背景后的信息和蕴藏的知识,这就对档案大数据的应用提出了更高的要求。因此,档案大数据的应用,应该从源头进行规划,建立一套逻辑结构元数据和档案业务元数据系统来进行数据的管理和维护,实现数据的关联性分析、元数据查询以及档案数据治理等功能。此外,为了展现海量数据的查询结果多样性、多角度、多层次,档案大数据需要应用数据可视化的相关技术,因为可视化技术是最佳的结果展示方式之一,通过清晰的图形图像可以直观反映出最终结果。
2.3 数字档案馆云平台建设
由于档案数字资源庞大、种类繁多、结构复杂,不同的档案数据中蕴含的价值差异很大,因此不可避免的会导致用户获取有价值信息的难度增大。数字档案馆云平台就是解决这类问题的有效途径,云平台可以基于现有的IT基础设施进行建设,也可以依托大数据专业机构提供的云服务。EMC存储专家和资深产品经理李君鹏认为,大数据本身就是一个问题集,云技术是目前解决大数据问题集最有效的手段。
3.企业数字档案馆建设的策略
随着大数据时代的到来,企业数字档案馆建设也将面临新的挑战,如何对大数据进行管理、储存、信息挖掘和提供利用都将是亟待解决的问题,这就要求企业在建设数字档案馆的时候,要从整体进行规划,结合企业实际需求和发展趋势,确定功能定位,制定数字档案馆建设的策略,应对大数据可能对企业生产经营活动造成的影响。
3.1 加强数字档案馆顶层设计
企业数字档案馆建设是一个不断完善和持续改进的过程,在推进过程中,档案部门应当做好顶层规划设计,充分考虑档案工作的发展趋势并论证方案的可行性,才能更好地推进数字档案馆建设。企业档案部门应当根据数字档案馆系统建设、业务集成、数据共享及运行服务等需求,加快相关规范、制度和标准的出台,使企业档案工作有章可循。在制定规章制度时,应首先考虑采用国际标准,其次才是国家、行业以及地方标准,并尽可能采用适用范围比较广泛的标准。
3.2 提高企业档案信息化设施水平
加大投入改善档案软、硬件设施水平。首先,优化配置各种资源,企业根据实际需要,为档案管理部门配备必要的硬件设施,并随着需求发展不断升级完善,从长远考虑为满足数字档案馆建设的需要,逐步实现档案云平台建设目标。其次,立足于公司发展的需要,建立大数据采集系统,丰富信息资源体系。最后,为方便知识的利用,企业应以内部局域网为依托,采用标准的B/S(浏览器/服务器)模式,以数据库技术为支撑,基于智能检索技术和网络技术,不断优化档案可视化技术,以满足多样化、个性化的利用需求。
3.3建立一支专业的档案信息化人才队伍
数字档案馆建设、应用与维护等工作与信息技术的发展有着非常紧密的联系,这就决定了数字档案馆的运营模式有别于传统实体档案馆,经营管理数字档案馆的工作团队不仅要掌握档案专业管理知识,还要拥有一定的信息技术水平,熟练掌握常用的计算机技术、网络技术以及数据库技术,能够独立承担起数字档案馆日常运行和维护工作。这就需要企业建立一支专业的信息化人才队伍,承担起大数据时代下的企业数字档案馆建设和档案信息化工作的重任。
4.结束语
建设数字档案馆是一项长期复杂的系统工程,其建设内容包括顶层架构设计、档案数据资源的整合利用、档案信息云平台搭建、人才队伍培养以及系统运行维护等多个方面。而大数据时代的到来,对企业数字档案馆建设提出了更高的要求,如何从海量数据中挖掘、分析有价值的信息并通过可视化的技术展现出来是亟待解决的问题。知识管理已经成为档案管理的发展趋势,企业建设数字档案馆的目的就是强化知识的有机联系,通过强大而灵活的分布式检索功能,保证档案信息的高度共享,为企业发展提供多样化的知识支撑。
参考文献
[1] 马建光,姜巍.大数据的概念、特征及应用[J].国防科技,2013(2):10-13.
[2] 薛四新,张晓.论数字档案馆的共建与共享[J].档案学研究,2010(2):65-67.
[3] 兰祝刚,惠英,李刚.大数据时代下的档案工作[J].中国档案,2013(9):74-75.
[4] 陶水龙,大数据时代下数字档案馆面临的机遇与挑战[J].中国档案,2013(10):66-68.
关键词:大数据;数字档案馆;知识管理
引言
随着互联网技术的飞速发展,特别是物联网、社交网络和云计算的兴起,全球数据量急剧增长,数据种类也越来越多样化,各种非结构化和半结构化数据大量涌现,数据资源已经成为了当今社会增长最快的资源之一。根据国际数据公司IDC 监测统计,人类产生的数据量正在呈指数级增长,大约每两年翻一番,并且这个速度在一段时间内会继续保持下去。海量、多源异构的数据给企业管理和发展带了很大挑战,在传统的数据存储、分析、挖掘技术难以实时处理大量非结构化信息的情况下,大数据的概念应运而生。
1.大数据的概念与特征
大数据是一个比较抽象的概念,在信息科学领域至今尚无确切、统一的定义,在维基百科中对大数据如此定义:大数据是指利用常用软件工具来获取、管理和处理数据所消耗时间超过可容忍时间的数据集。这是一个模糊性的定义,因为它对常用软件和可容忍时间的范围并未明确界定。研究机构Gartner也对大数据进行了定义:大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量的、高增长率和多样化的信息资产。这是一个描述性的定义,在数据处理的基础上加入此类数据的一些特征,并用这些特征描述大数据。总的来说,尽管各方对大数据的表述不一,但其内涵一致,从本质上来说,大数据主要解决的是海量数据存储、计算、挖掘和展示的问题。
国内外学者经过多年的研究,目前,尽管对大数据的定义尚有分歧但对于大数据的特征已经达成了共识:数据规模大(Volume),数据种类多(Variety),处理速度快(Velocity),数据价值密度低(Value),称之为四“V”特性。
2.大数据对企业数字档案馆建设的影响
由于大数据具有数据量巨大、数据类型繁多、价值密度低和处理速度快的四“V”特点,因此大数据不仅对企业信息化工作带来了新的挑战,也对数字档案馆建设与发展产生了很大的影响。
2.1档案大数据的获取
在信息化高速发展的今天,档案信息资源也呈現出复杂性和多样性的特点,从技术实施的角度来看,档案大数据可以从两个维度来考虑:数据结构类型和实效性。从数据结构类型上分析,要同时支持结构化数据(来源于关系数据库)、半结构化数据(来源于格式化文件如XML)、非结构化数据(电子照片、音频文件和视频文件等)。2019年12月26日,我国最高人民法院公布了《最高人民法院关于修改<关于民事诉讼证据的若干规定>的决定》,该决定第四十条规定,电子数据包括网页、博客、微博客等网络平台发布的信息;手机短信、电子邮件、即时通信、通讯群组等网络应服务的通讯信息都可以作为正式打官司的证据,进一步说明了档案资源的数据类型与获取渠道将日益广泛化。从实效性的维度分析,由于大数据反映的是一种趋势,通过数据量的变化推断出事件发生的概率,数据量越大概率也会越准确,因此单一数据的时效性和价值将会逐渐弱化。
2.2档案大数据的应用
知识管理是档案管理发展的趋势,档案用户已不满足于数据或文件的查询利用,更希望获取数据背景后的信息和蕴藏的知识,这就对档案大数据的应用提出了更高的要求。因此,档案大数据的应用,应该从源头进行规划,建立一套逻辑结构元数据和档案业务元数据系统来进行数据的管理和维护,实现数据的关联性分析、元数据查询以及档案数据治理等功能。此外,为了展现海量数据的查询结果多样性、多角度、多层次,档案大数据需要应用数据可视化的相关技术,因为可视化技术是最佳的结果展示方式之一,通过清晰的图形图像可以直观反映出最终结果。
2.3 数字档案馆云平台建设
由于档案数字资源庞大、种类繁多、结构复杂,不同的档案数据中蕴含的价值差异很大,因此不可避免的会导致用户获取有价值信息的难度增大。数字档案馆云平台就是解决这类问题的有效途径,云平台可以基于现有的IT基础设施进行建设,也可以依托大数据专业机构提供的云服务。EMC存储专家和资深产品经理李君鹏认为,大数据本身就是一个问题集,云技术是目前解决大数据问题集最有效的手段。
3.企业数字档案馆建设的策略
随着大数据时代的到来,企业数字档案馆建设也将面临新的挑战,如何对大数据进行管理、储存、信息挖掘和提供利用都将是亟待解决的问题,这就要求企业在建设数字档案馆的时候,要从整体进行规划,结合企业实际需求和发展趋势,确定功能定位,制定数字档案馆建设的策略,应对大数据可能对企业生产经营活动造成的影响。
3.1 加强数字档案馆顶层设计
企业数字档案馆建设是一个不断完善和持续改进的过程,在推进过程中,档案部门应当做好顶层规划设计,充分考虑档案工作的发展趋势并论证方案的可行性,才能更好地推进数字档案馆建设。企业档案部门应当根据数字档案馆系统建设、业务集成、数据共享及运行服务等需求,加快相关规范、制度和标准的出台,使企业档案工作有章可循。在制定规章制度时,应首先考虑采用国际标准,其次才是国家、行业以及地方标准,并尽可能采用适用范围比较广泛的标准。
3.2 提高企业档案信息化设施水平
加大投入改善档案软、硬件设施水平。首先,优化配置各种资源,企业根据实际需要,为档案管理部门配备必要的硬件设施,并随着需求发展不断升级完善,从长远考虑为满足数字档案馆建设的需要,逐步实现档案云平台建设目标。其次,立足于公司发展的需要,建立大数据采集系统,丰富信息资源体系。最后,为方便知识的利用,企业应以内部局域网为依托,采用标准的B/S(浏览器/服务器)模式,以数据库技术为支撑,基于智能检索技术和网络技术,不断优化档案可视化技术,以满足多样化、个性化的利用需求。
3.3建立一支专业的档案信息化人才队伍
数字档案馆建设、应用与维护等工作与信息技术的发展有着非常紧密的联系,这就决定了数字档案馆的运营模式有别于传统实体档案馆,经营管理数字档案馆的工作团队不仅要掌握档案专业管理知识,还要拥有一定的信息技术水平,熟练掌握常用的计算机技术、网络技术以及数据库技术,能够独立承担起数字档案馆日常运行和维护工作。这就需要企业建立一支专业的信息化人才队伍,承担起大数据时代下的企业数字档案馆建设和档案信息化工作的重任。
4.结束语
建设数字档案馆是一项长期复杂的系统工程,其建设内容包括顶层架构设计、档案数据资源的整合利用、档案信息云平台搭建、人才队伍培养以及系统运行维护等多个方面。而大数据时代的到来,对企业数字档案馆建设提出了更高的要求,如何从海量数据中挖掘、分析有价值的信息并通过可视化的技术展现出来是亟待解决的问题。知识管理已经成为档案管理的发展趋势,企业建设数字档案馆的目的就是强化知识的有机联系,通过强大而灵活的分布式检索功能,保证档案信息的高度共享,为企业发展提供多样化的知识支撑。
参考文献
[1] 马建光,姜巍.大数据的概念、特征及应用[J].国防科技,2013(2):10-13.
[2] 薛四新,张晓.论数字档案馆的共建与共享[J].档案学研究,2010(2):65-67.
[3] 兰祝刚,惠英,李刚.大数据时代下的档案工作[J].中国档案,2013(9):74-75.
[4] 陶水龙,大数据时代下数字档案馆面临的机遇与挑战[J].中国档案,2013(10):66-68.