论文部分内容阅读
随着信息化的不断发展,数字信息呈现着惊人的增长速度,使得大量的数字资源面临着长期保存的难题。当前,数字信息长期保存的研究主要围绕保存元数据、系统架构和迁移等技术机制展开。在数字信息长期保存系统中,保存元数据作为最重要的信息,被不断的完善和标准化。为了提供保存元数据,引入来源感知技术,自动收集来源信息,为迁移等技术策略提供保存元数据,增强数字信息长期保存系统的智能性和效率。在数字信息长期保存中引入来源感知技术,根据长期保存的OAIS(OpenArchivalInformation System)架构和来源感知的相关技术,设计出数字信息长期保存来源感知系统的总体系统架构,从来源收集、来源存储和来源查询三个模块对系统进行设计与实现。在来源收集模块中设计来源数据和关系模型,并结合当前电子元数据标准,提出来源信息类型,通过截取和分析系统调用的方法,实现对来源信息的收集;在来源存储模块中对所收集的来源进行消环、去除重复并为对象分配标识符,最终将来源以日志文件的形式保存在磁盘上;在来源查询模块中对来源日志文件进行解析,以非关系数据库或者对象集中式的方式组织来源,并提供来源查询功能。最后,测试了系统的基本来源收集功能,并查询和应用系统所收集到的来源信息,结合数字信息长期保存的技术策略,实现了基于来源的格式迁移,从而验证了来源感知技术在数字信息长期保存中的重要性。