论文部分内容阅读
(天津市市区不动产登记事务中心河西部 天津 300201)
一、 电子文件的特征
电子文件在某些特征上与纸质文件有很大的区别。要管理好电子文件就必须了解其的特征。综合国内外对此问题的研究,电子文件的主要特征可概括为:
1、 电子文件的数字化信息技术是在计算机中产生和处理的,其信息形态是数字化的,人们在计算机屏幕上看到由文字、图形等构成的电子形态只不过是电子文件的某种输出形式而已。而在计算机内部,无论是传输还是存储等处理,电子文件均是以数字编码的形式存在的。
计算机录入汉字的方法有多种,首先是输入时对汉字进行计算机的外码转换。可以用汉语拼音等外码录入汉字。计算机接收了其个别汉字外码之后,接着把外码代表的汉字用计算机内码记录下来。计算机内码是以16位二进制数字表示的。计算机内进行文件信息的存储、传输等处理就是对这些内码的处理。只有当需要将文件输出时,才将其汉字内码所对应的字形点阵。也就是字模,以及众多字模按格式组成文章在屏幕或打印机上输出。
在计算机多媒体技术的支持下,文件信息数据还可以包括声音、影像等多种形式。
电子文件从一个载体复制到另一个载体,实质上是在计算机内进行信号的传输处理。只要技术方法得当,就可以完全恢复到与原信号一样。
2、 电子文件的形成和各种处理均是在计算机等设备的支持下完成的,离开计算机等设备,电子文件既看不见也摸不着。其对设备依赖性主要体现在:一是数字编码,二是硬件,三是软件,四是技术设备更新,五是加密。
电子文件的运作、管理是建立在一套标准化体系之上的,其严格程度和对系统性的要求,均远远超过纸质文件的标准化体系。建立和熟悉电子文件的标准化体系,是保证电子文件妥善归档的重要前提。
在网络环境下,人们对信息的处理标准化问题解决得好一些,但对记录载体的交换问题仍然很多。出于安全保密上的考虑还常常通过特殊的软、硬设备人为地进行复杂而独特的编码加密或信息拆分处理,使需要保密的电子文件只能在特定的环境下被读取。计算机更新换代很快,常常只能隔代兼容,对于需要长期归档保存的电子文件来说,设备依赖性造成的问题会更加严重。
3、 电子文件的非直读性体现在很多方面。一是数字编码记录于载体上肉眼无法分辨,例如一张容量可达600MB-4000MB的光盘,刻写激光斑点的直径小于百万分之一毫米,可存35万张打印纸上的文字信息。即使在高倍显微镜下可以看见光盘上的记录痕迹,也不可能读懂那些小点表示的是什么。另外,载体上的数字信息往往进行了压缩编码、加密等处理,即使有设备,如果不解压解密也是不能读取其内容的。以上种种因素均决定了电子文件载体的非直读性。
4、 文件的物理结构是指其信息存储于载体上的位置及分布情况,纸质文件的信息物理结构与逻辑结构是一致的,而且是直观的。电子文件的信息物理结构和逻辑结构往往是不一致的,同一份電子文件中的正文、图形、批示、附件等可以不要载体上连续存放,甚至可以存放在不同载体上,而不影响其正常地显示输出。在电子文件信息的处理过程中,其物理结构经常发生变化,而其逻辑结构却可以保持不变。电子文件的逻辑结构通常也是需要专门的信息予以描述,当然这些信息可能是隐含的,无特殊需要而不显示出来。正是由于这种原因,电子文件的物理结构和逻辑结构之间关系是很复杂的。在电子文件归档时,如何保持其物理结构和逻辑结构的复杂关系,是保证电子文件不被坡坏而必须注意的关键问题之一。
元素据是关于数据的数据。对于纸质文件来说,元数据往往直接体现在其形态上,如一份印好的文件,纸上的文字、图形排列及格式等。电子文件的这种元数据必须特意附在文件信息中,否则将无法恢复电子文件的原貌。此外,纸质文件由于在传递和处理过程中离不开行政部门的实际往来和人工办理各种手续,由其生成和运作的背景信息也就自然地记录在文件上了。电子文件的运作往往是在网络上进行的,操作者互不见面,体现行政背景关系的信息可能存放在其他地方。如不特意提供或补充这些元数据或背景信息,就可能给电子文件的运作和归档带来问题。
5、 电子文件的存放位置不是固定的,而是可以变化的,甚至可以从一个载体转换到另一个载体,其内容信息却不发生任何变化。同样,还可以通过网络传给远方的一个或多个接收者。在一些对保密有特殊要求的网络中,还采取把电子文件分解后分别通过不同的途径传递,存放在不同地点的不同设备上,只是在需要时临时把文件装配起来。这些情况,不仅造成电子文件与载体的分离性,也使长期处于共享计算机网络资源环境的使用者淡漠了对电子文件存储于哪台计算机、哪个载体以及什么位置的关系。这个特征给电子文件的保管带来许多新的问题,处理不好,会直接影响其真实性、完整性和可靠性。
二、 电子文件生命周期理论
文件生命周期理论是档案学的基本理论。上个世纪40年代初, 在美国出现了文件生命周期理论。1950年8月,英国罗吉尔。艾利斯教授在第一届国际档案大会上正式提出了文件生命劃分的“三阶段理论”(即文件的现行、休眠或暂时保存、销毁或永久保存),标志着文件生命周期理论的诞生。此后,经过欧美国家的一些档案学者的进一步探索,在20世纪80年代中后期得到定型,并为国际档案界所接受。自20世纪90年代中后期开始,电子文件开始大量涌现。由于电子文件具有与纸质文件许多不同的特点,于是档案学界在文件生命周期理论的基础上,又提出电子文件生命周期理论、文件连续性理论来支持电子文件管理。
文件生命周期理论的基本内容可以概括为:文件从其形成到销毁或永久保存是一个整体运动过程;文件的整体运动过程由于文件价值形态的变化可划分为若干阶段;不同阶段的文件与服务对象、保存场所和管理方式之间存在的对应关系。生命周期理论立足于文件及档案本身的价值及其价值形态的变化规律,并根据不同价值的不同实现规律指导特定阶段的管理活动的理论观点,为解决电子文件管理的原始性、真实性、完整性;电子文件的收集、归档;电子文件的原始性保证、真实性保证、完整性保证;电子文件的开发利用;纸质文件和电子文件并列运行的过渡期进行管理等一系列问题提供了思路。
正是基于对文件生命周期理论的认识和理解,我单位开始研究面向实际的信息化管理系统,通过数年的努力,初步建立起了一套基本符合档案工作规范、档案管理标准及基本原则且适应电子化时代的文件管理体系。该体系包括电子文件运行系统,电子文件归档系统,纸质文件与电子文件双套管理系统。涵盖了文件的生成、收集、保管、利用等各个阶段,紧密连接,互相保证,互相依据,保证了电子文件的真实性、完整性和有效性的要求。
一、 电子文件的特征
电子文件在某些特征上与纸质文件有很大的区别。要管理好电子文件就必须了解其的特征。综合国内外对此问题的研究,电子文件的主要特征可概括为:
1、 电子文件的数字化信息技术是在计算机中产生和处理的,其信息形态是数字化的,人们在计算机屏幕上看到由文字、图形等构成的电子形态只不过是电子文件的某种输出形式而已。而在计算机内部,无论是传输还是存储等处理,电子文件均是以数字编码的形式存在的。
计算机录入汉字的方法有多种,首先是输入时对汉字进行计算机的外码转换。可以用汉语拼音等外码录入汉字。计算机接收了其个别汉字外码之后,接着把外码代表的汉字用计算机内码记录下来。计算机内码是以16位二进制数字表示的。计算机内进行文件信息的存储、传输等处理就是对这些内码的处理。只有当需要将文件输出时,才将其汉字内码所对应的字形点阵。也就是字模,以及众多字模按格式组成文章在屏幕或打印机上输出。
在计算机多媒体技术的支持下,文件信息数据还可以包括声音、影像等多种形式。
电子文件从一个载体复制到另一个载体,实质上是在计算机内进行信号的传输处理。只要技术方法得当,就可以完全恢复到与原信号一样。
2、 电子文件的形成和各种处理均是在计算机等设备的支持下完成的,离开计算机等设备,电子文件既看不见也摸不着。其对设备依赖性主要体现在:一是数字编码,二是硬件,三是软件,四是技术设备更新,五是加密。
电子文件的运作、管理是建立在一套标准化体系之上的,其严格程度和对系统性的要求,均远远超过纸质文件的标准化体系。建立和熟悉电子文件的标准化体系,是保证电子文件妥善归档的重要前提。
在网络环境下,人们对信息的处理标准化问题解决得好一些,但对记录载体的交换问题仍然很多。出于安全保密上的考虑还常常通过特殊的软、硬设备人为地进行复杂而独特的编码加密或信息拆分处理,使需要保密的电子文件只能在特定的环境下被读取。计算机更新换代很快,常常只能隔代兼容,对于需要长期归档保存的电子文件来说,设备依赖性造成的问题会更加严重。
3、 电子文件的非直读性体现在很多方面。一是数字编码记录于载体上肉眼无法分辨,例如一张容量可达600MB-4000MB的光盘,刻写激光斑点的直径小于百万分之一毫米,可存35万张打印纸上的文字信息。即使在高倍显微镜下可以看见光盘上的记录痕迹,也不可能读懂那些小点表示的是什么。另外,载体上的数字信息往往进行了压缩编码、加密等处理,即使有设备,如果不解压解密也是不能读取其内容的。以上种种因素均决定了电子文件载体的非直读性。
4、 文件的物理结构是指其信息存储于载体上的位置及分布情况,纸质文件的信息物理结构与逻辑结构是一致的,而且是直观的。电子文件的信息物理结构和逻辑结构往往是不一致的,同一份電子文件中的正文、图形、批示、附件等可以不要载体上连续存放,甚至可以存放在不同载体上,而不影响其正常地显示输出。在电子文件信息的处理过程中,其物理结构经常发生变化,而其逻辑结构却可以保持不变。电子文件的逻辑结构通常也是需要专门的信息予以描述,当然这些信息可能是隐含的,无特殊需要而不显示出来。正是由于这种原因,电子文件的物理结构和逻辑结构之间关系是很复杂的。在电子文件归档时,如何保持其物理结构和逻辑结构的复杂关系,是保证电子文件不被坡坏而必须注意的关键问题之一。
元素据是关于数据的数据。对于纸质文件来说,元数据往往直接体现在其形态上,如一份印好的文件,纸上的文字、图形排列及格式等。电子文件的这种元数据必须特意附在文件信息中,否则将无法恢复电子文件的原貌。此外,纸质文件由于在传递和处理过程中离不开行政部门的实际往来和人工办理各种手续,由其生成和运作的背景信息也就自然地记录在文件上了。电子文件的运作往往是在网络上进行的,操作者互不见面,体现行政背景关系的信息可能存放在其他地方。如不特意提供或补充这些元数据或背景信息,就可能给电子文件的运作和归档带来问题。
5、 电子文件的存放位置不是固定的,而是可以变化的,甚至可以从一个载体转换到另一个载体,其内容信息却不发生任何变化。同样,还可以通过网络传给远方的一个或多个接收者。在一些对保密有特殊要求的网络中,还采取把电子文件分解后分别通过不同的途径传递,存放在不同地点的不同设备上,只是在需要时临时把文件装配起来。这些情况,不仅造成电子文件与载体的分离性,也使长期处于共享计算机网络资源环境的使用者淡漠了对电子文件存储于哪台计算机、哪个载体以及什么位置的关系。这个特征给电子文件的保管带来许多新的问题,处理不好,会直接影响其真实性、完整性和可靠性。
二、 电子文件生命周期理论
文件生命周期理论是档案学的基本理论。上个世纪40年代初, 在美国出现了文件生命周期理论。1950年8月,英国罗吉尔。艾利斯教授在第一届国际档案大会上正式提出了文件生命劃分的“三阶段理论”(即文件的现行、休眠或暂时保存、销毁或永久保存),标志着文件生命周期理论的诞生。此后,经过欧美国家的一些档案学者的进一步探索,在20世纪80年代中后期得到定型,并为国际档案界所接受。自20世纪90年代中后期开始,电子文件开始大量涌现。由于电子文件具有与纸质文件许多不同的特点,于是档案学界在文件生命周期理论的基础上,又提出电子文件生命周期理论、文件连续性理论来支持电子文件管理。
文件生命周期理论的基本内容可以概括为:文件从其形成到销毁或永久保存是一个整体运动过程;文件的整体运动过程由于文件价值形态的变化可划分为若干阶段;不同阶段的文件与服务对象、保存场所和管理方式之间存在的对应关系。生命周期理论立足于文件及档案本身的价值及其价值形态的变化规律,并根据不同价值的不同实现规律指导特定阶段的管理活动的理论观点,为解决电子文件管理的原始性、真实性、完整性;电子文件的收集、归档;电子文件的原始性保证、真实性保证、完整性保证;电子文件的开发利用;纸质文件和电子文件并列运行的过渡期进行管理等一系列问题提供了思路。
正是基于对文件生命周期理论的认识和理解,我单位开始研究面向实际的信息化管理系统,通过数年的努力,初步建立起了一套基本符合档案工作规范、档案管理标准及基本原则且适应电子化时代的文件管理体系。该体系包括电子文件运行系统,电子文件归档系统,纸质文件与电子文件双套管理系统。涵盖了文件的生成、收集、保管、利用等各个阶段,紧密连接,互相保证,互相依据,保证了电子文件的真实性、完整性和有效性的要求。