论文部分内容阅读
[摘 要]本文分析了在电子信息及网络条件下,档案本身及数字化信息的特点。对档案管理中基于物理介质与数字化信号的档案信息管理结合点,即界限问题进行了探讨和调研,探讨了在档案管理中如何建立体现二者优势的档案信息管理体系。
[关键词]档案信息 数字化 数据转换
中图分类号:N9211 文献标识码:A 文章编号:1009-914X(2015)13-0314-01
一、档案数字化的概念
数字化本质就是将人们感受到的信息抽象为可以度量的用符号表达的数字、数据,再将这些数字、数据按照一定的数字化模型转换为一系列计算机可以识别的二进制代码,从而可以通过计算机对这些数据进行高效的处理、储存、传输,这就是数字化的基本过程。档案数字化无疑就是将存储于传统载体上的档案信息进行数字化,在信息化技术日益发展的今天,档案数字化也随之迅速发展起来。事实上,各种原始的档案资料数字化具有技术的可行性,在我们描述信息的二进制序列过程中,无论采样的频率有多高,总是存在于实际事物的差别。
档案是人们处理事务过程中遗留下来的副产品,它使人们进行社会实践活动附带的产物,或者它是自然形成的,而不是纯粹人为的结果。尽管不能机械地理解原始性的含义,但是毫无疑问档案的历史性、真实性是其本质属性。
档案信息数字化的工程不能成为一种时尚,而要在保证档案基本属性的情况下借助于现代信息技术扩展其作用范围,提高其效率。因此需要从档案的特点、成本、效益等方面综合考虑,确定出数字化与非数字化的界限,按照科学合理的方案进行数字化建设。
二、档案管理数字化的目标
档案有两种基本价值,一种是历史凭证价值,从档案的基本属性和档案的内容、形式、特征看,档案是真实可靠的,具有法律效力;另一种是情报信息价值,从档案的信息存储和所反映的内容来看,档案信息可供各项工作借鉴、参考。由此可见档案管理的主要价值体现在真实的凭证作用方面,而对效率要求相对处于较次要的地位。
对现实中的信息完全数字化的优势,在于其强大的计算机处理能力、高效的查询功能及信息管理与共享能力,在效率优先的前提下数字化是必须的工作。而对档案的数字化处理必须结合其档案利用的特点与数字化的优势,找出一个最好的结合点。
因此,我个人认为档案管理信息化的目标是在保证档案原始凭证性、真实性、安全性的前提下,利用数字化的优势,提高其管理、查询与传输效率,扩展其服务功能特别是数据挖掘功能。
三、档案管理的数字化现状与问题研究
现有的数字化档案管理系统大部分基于关系数据库系统,基本实现了档案的编目、检索、统计、出借等日常管理,其本质是在原有的档案管理体系上附加了计算机软件,这在一定程度上提高了档案管理工作的效率。但就当前现状而言,档案管理数字化工作面临着一些问题。主要表现在以下几个方面:
1.档案管理数字化的界限问题
档案中哪些内容数字化、哪些内容以原始的内容保存或者二者都进行,都不能十分明确,极端的做法是尽其所能通过键盘、采集卡及扫描设备将其内容全部数字化。
2、档案管理数字化的标准问题
档案信息数字化无相关电子数据标准,不同档案部门数据结构格式不统一,尽管可以通过大量元数据来克服这样不一致的问题,但不利于网络条件下的档案信息的高效率共享。
3、档案数字化信息的管理问题
工作不协调,数字化过程与对数字化信息的管理不能同步进行,所有原始材料的数字化虽然技术上容易实现,但是对于较大型的档案管理部门数字化将是漫长的工作,即使完全数字化了,将会涉及大量异构数据的检索、转存及管理。如果相应的检索和验证管理软件跟不上的话会使问题复杂化,许多前期工作将会前功尽弃。
4.档案数字化信息的安全性问题
数字化后的电子信息安全性与可靠性问题十分突出,如何保证数字化后的信息不被随意访问、篡改、复制是一个十分复杂的问题。要解决这样的安全问题,需要利用计算机数据安全技术,单从技术特征来说要解决的问题是数据的完整性、保密性和可用性,涉及的技术包括数据加密与数字水印。档案信息是需要长期保存的,这将导致加密密钥的管理变的十分困难,因为密钥安全性不仅在于计算的复杂性,而且还在于不断更新,而数字水印技术在一定程度上必然导致原始数字信息的失真,从而进一步破坏档案的原始凭证性功能。
以上数字化过程中,如何平衡各个影响因素,需要我们仔细分析,事实上,以上所有问题都是由界限不清晰带来的,即所有档案材料中,哪些部分数字化、哪些内容不数字化不是十分明确。
四、档案管理的数字化界限划分
如果从档案管理的主要作用来分析,既然是用来作为凭证的,其效率要求相对来说较低。对所要求的凭证信息在一日内一般都能查询确定,就目前的管理体系来说完全能够达到其所要求的效率。因此,数字化的作用在于提高利用效率的同时,扩展原有档案信息的利用价值,即除了其凭证功能外扩展其分析价值,通过对以前档案资料的统计分析及信息挖掘为决策未来提供必要的支持
在实现了对档案的目录、案卷、出借、查询、统计等基本外延信息计算机管理的基础上,我们可以将进一步的档案内容数字化按照需求分为两种,一种是以方便管理应用为主要需求的数字化工程,一种是以分析应用为主要需求的数字化工程。对于大部分单位的档案管理来说,前者不具有普遍性,因此通过分析我们知道,从应用的角度分析其所带来的好处只是检索速度的提高与信息共享的方便,但是,以上均不是档案管理信息主要利用价值的体现,因为其存储、检索与安全维护的代价是巨大的,况且对大量异构数据的管理与应用会增加档案利用的复杂性,从成本利益及安全角度考虑也是不科学的。
所以,以分析应用为主的数字化实现才是最佳的选择,它可以在保证档案管理最基本特征及利用价值的基础上,利用现代信息技术扩展其利用价值,通过对其以前的信息进行数据挖掘,从而为决策分析提供服务。在此前提下应该建立档案管理信息系统、数据仓库、原始档案材料三级管理与应用模式。
1.档案管理信息系统
档案管理信息系统是对档案材料存在与利用信息的数字化及管理系统,具体数字化及管理的内容主要包括:档案的实物存储位置信息、属性信息、审核信息、出借利用信息、统计信息等。
2、数据仓库
与事务处理数据库系统不同,数据仓库是从多个数据源中收集的一个信息仓储,是整合的、主题导向的、长期积累的且内容不频繁更换的数据集合。采用数据仓库的技术,将来源于不同档案部门管理信息的信息资源复制集中到一个数据库中,形成一个资源信息中心。
由于数据仓库不常被修改,也不用于通常的事务处理,只是用于查询、数据挖掘、分析,因此其一定程度的数据冗余是允许的。另外,数据仓库的特性也是符合档案管理的基本应用要求的。
基于数据仓库的数据的单向流动保证了数据的安全性,分布于各个档案部门的数据单向地转储到数据仓库中可以在两方面保证数据的安全性,即使从数据共享的角度来看,作为数据仓库的用户来说,本质上只有只读权限,堵塞了数据的安全漏洞。
建立数据仓库时,数字化的内容并不需要所有的原始档案材料,而可以是能反映原始档案信息内容与作用的摘要信息。它既能够作为查询与信息共享的数据源,又可以作为数据挖掘从而进行决策分析的数据源。
3.原始档案材料
它指的是以原始状态存在的归档材料,是最终其原始凭证作用的材料,只有这些材料才是可靠真实的。其形式包括文本、图形图像、视频等,大部分为模拟状态存在的自然信息。它是数字化信息的物理映像,与相关的数字化信息构成一一对应关系,它是管理信息系统及数据仓库的基础。原始材料在某些情况下也可考虑对其进行数字化,一是条件允许的情况下,特别是在管理与安全技术成熟的情况下,可以作为一个管理分支进行数字化管理;二是需要传输利用的情况下,通过数字化可以将档案材料在网络上实现快速传输与共享。
[关键词]档案信息 数字化 数据转换
中图分类号:N9211 文献标识码:A 文章编号:1009-914X(2015)13-0314-01
一、档案数字化的概念
数字化本质就是将人们感受到的信息抽象为可以度量的用符号表达的数字、数据,再将这些数字、数据按照一定的数字化模型转换为一系列计算机可以识别的二进制代码,从而可以通过计算机对这些数据进行高效的处理、储存、传输,这就是数字化的基本过程。档案数字化无疑就是将存储于传统载体上的档案信息进行数字化,在信息化技术日益发展的今天,档案数字化也随之迅速发展起来。事实上,各种原始的档案资料数字化具有技术的可行性,在我们描述信息的二进制序列过程中,无论采样的频率有多高,总是存在于实际事物的差别。
档案是人们处理事务过程中遗留下来的副产品,它使人们进行社会实践活动附带的产物,或者它是自然形成的,而不是纯粹人为的结果。尽管不能机械地理解原始性的含义,但是毫无疑问档案的历史性、真实性是其本质属性。
档案信息数字化的工程不能成为一种时尚,而要在保证档案基本属性的情况下借助于现代信息技术扩展其作用范围,提高其效率。因此需要从档案的特点、成本、效益等方面综合考虑,确定出数字化与非数字化的界限,按照科学合理的方案进行数字化建设。
二、档案管理数字化的目标
档案有两种基本价值,一种是历史凭证价值,从档案的基本属性和档案的内容、形式、特征看,档案是真实可靠的,具有法律效力;另一种是情报信息价值,从档案的信息存储和所反映的内容来看,档案信息可供各项工作借鉴、参考。由此可见档案管理的主要价值体现在真实的凭证作用方面,而对效率要求相对处于较次要的地位。
对现实中的信息完全数字化的优势,在于其强大的计算机处理能力、高效的查询功能及信息管理与共享能力,在效率优先的前提下数字化是必须的工作。而对档案的数字化处理必须结合其档案利用的特点与数字化的优势,找出一个最好的结合点。
因此,我个人认为档案管理信息化的目标是在保证档案原始凭证性、真实性、安全性的前提下,利用数字化的优势,提高其管理、查询与传输效率,扩展其服务功能特别是数据挖掘功能。
三、档案管理的数字化现状与问题研究
现有的数字化档案管理系统大部分基于关系数据库系统,基本实现了档案的编目、检索、统计、出借等日常管理,其本质是在原有的档案管理体系上附加了计算机软件,这在一定程度上提高了档案管理工作的效率。但就当前现状而言,档案管理数字化工作面临着一些问题。主要表现在以下几个方面:
1.档案管理数字化的界限问题
档案中哪些内容数字化、哪些内容以原始的内容保存或者二者都进行,都不能十分明确,极端的做法是尽其所能通过键盘、采集卡及扫描设备将其内容全部数字化。
2、档案管理数字化的标准问题
档案信息数字化无相关电子数据标准,不同档案部门数据结构格式不统一,尽管可以通过大量元数据来克服这样不一致的问题,但不利于网络条件下的档案信息的高效率共享。
3、档案数字化信息的管理问题
工作不协调,数字化过程与对数字化信息的管理不能同步进行,所有原始材料的数字化虽然技术上容易实现,但是对于较大型的档案管理部门数字化将是漫长的工作,即使完全数字化了,将会涉及大量异构数据的检索、转存及管理。如果相应的检索和验证管理软件跟不上的话会使问题复杂化,许多前期工作将会前功尽弃。
4.档案数字化信息的安全性问题
数字化后的电子信息安全性与可靠性问题十分突出,如何保证数字化后的信息不被随意访问、篡改、复制是一个十分复杂的问题。要解决这样的安全问题,需要利用计算机数据安全技术,单从技术特征来说要解决的问题是数据的完整性、保密性和可用性,涉及的技术包括数据加密与数字水印。档案信息是需要长期保存的,这将导致加密密钥的管理变的十分困难,因为密钥安全性不仅在于计算的复杂性,而且还在于不断更新,而数字水印技术在一定程度上必然导致原始数字信息的失真,从而进一步破坏档案的原始凭证性功能。
以上数字化过程中,如何平衡各个影响因素,需要我们仔细分析,事实上,以上所有问题都是由界限不清晰带来的,即所有档案材料中,哪些部分数字化、哪些内容不数字化不是十分明确。
四、档案管理的数字化界限划分
如果从档案管理的主要作用来分析,既然是用来作为凭证的,其效率要求相对来说较低。对所要求的凭证信息在一日内一般都能查询确定,就目前的管理体系来说完全能够达到其所要求的效率。因此,数字化的作用在于提高利用效率的同时,扩展原有档案信息的利用价值,即除了其凭证功能外扩展其分析价值,通过对以前档案资料的统计分析及信息挖掘为决策未来提供必要的支持
在实现了对档案的目录、案卷、出借、查询、统计等基本外延信息计算机管理的基础上,我们可以将进一步的档案内容数字化按照需求分为两种,一种是以方便管理应用为主要需求的数字化工程,一种是以分析应用为主要需求的数字化工程。对于大部分单位的档案管理来说,前者不具有普遍性,因此通过分析我们知道,从应用的角度分析其所带来的好处只是检索速度的提高与信息共享的方便,但是,以上均不是档案管理信息主要利用价值的体现,因为其存储、检索与安全维护的代价是巨大的,况且对大量异构数据的管理与应用会增加档案利用的复杂性,从成本利益及安全角度考虑也是不科学的。
所以,以分析应用为主的数字化实现才是最佳的选择,它可以在保证档案管理最基本特征及利用价值的基础上,利用现代信息技术扩展其利用价值,通过对其以前的信息进行数据挖掘,从而为决策分析提供服务。在此前提下应该建立档案管理信息系统、数据仓库、原始档案材料三级管理与应用模式。
1.档案管理信息系统
档案管理信息系统是对档案材料存在与利用信息的数字化及管理系统,具体数字化及管理的内容主要包括:档案的实物存储位置信息、属性信息、审核信息、出借利用信息、统计信息等。
2、数据仓库
与事务处理数据库系统不同,数据仓库是从多个数据源中收集的一个信息仓储,是整合的、主题导向的、长期积累的且内容不频繁更换的数据集合。采用数据仓库的技术,将来源于不同档案部门管理信息的信息资源复制集中到一个数据库中,形成一个资源信息中心。
由于数据仓库不常被修改,也不用于通常的事务处理,只是用于查询、数据挖掘、分析,因此其一定程度的数据冗余是允许的。另外,数据仓库的特性也是符合档案管理的基本应用要求的。
基于数据仓库的数据的单向流动保证了数据的安全性,分布于各个档案部门的数据单向地转储到数据仓库中可以在两方面保证数据的安全性,即使从数据共享的角度来看,作为数据仓库的用户来说,本质上只有只读权限,堵塞了数据的安全漏洞。
建立数据仓库时,数字化的内容并不需要所有的原始档案材料,而可以是能反映原始档案信息内容与作用的摘要信息。它既能够作为查询与信息共享的数据源,又可以作为数据挖掘从而进行决策分析的数据源。
3.原始档案材料
它指的是以原始状态存在的归档材料,是最终其原始凭证作用的材料,只有这些材料才是可靠真实的。其形式包括文本、图形图像、视频等,大部分为模拟状态存在的自然信息。它是数字化信息的物理映像,与相关的数字化信息构成一一对应关系,它是管理信息系统及数据仓库的基础。原始材料在某些情况下也可考虑对其进行数字化,一是条件允许的情况下,特别是在管理与安全技术成熟的情况下,可以作为一个管理分支进行数字化管理;二是需要传输利用的情况下,通过数字化可以将档案材料在网络上实现快速传输与共享。