论文部分内容阅读
名称规范文档是名称规范记录的集合,对于名称规范文档的控制和管理是图书馆规范控制工作的重要组成部分。目前我国的名称规范文档建设情况分散,虽然许多图书馆都建立了名称规范文档数据库,但对于规范文档资源的管理缺乏统一的标准,文档资源间异构性强、共享性程度差,导致这部分资源的利用效率低下。作为图书馆拥有的重要特色资源,名称规范文档的标准化建设和管理能有效提高图书馆的书目数据质量,名称规范文档的共享对于开放图书馆资源、使图书馆在更广泛的范围内实现其价值具有重要意义。语义网环境下,资源在互联网上的存在方式产生了巨大的变化,语义网提供了一种智能化的数据处理方式,让机器能够识别和理解数据,从语义层面解决了数据间的异构问题。关联数据是语义网的一种轻量级实现方式,特点是使用URIs对资源进行标记、RDF三元组形式描述、在资源间建立稳定的RDF链接,在保证资源唯一性的同时,使资源能实现系统内部以及跨系统的互操作,有效地实现了资源整合和共享,为解决名称规范文档的共享问题提供了可能性。本文对以中文个人名称规范文档为例,对语义网环境下的中文名称规范文档的共享问题进行了研究,研究主要从以下几个方面来展开:(1)分析国内名称规范文档建设过程中存在的问题,主要包括:创建规范记录时采用的编目规则和描述格式不同、名称实体的相关信息来源繁杂、对名称附加信息的使用没有详细的规定等。针对国内规范数据库的分散情况,提出中心式模型,由各机构贡献数据,中心库进行数据处理工作,对国内名称规范数据库进行初步整合;(2)在整合国内名称规范数据库的基础上,探索国内名称规范文档与虚拟国际规范文档的共享问题,通过对两个数据库的记录进行批量匹配实验,评估匹配效率,并针对匹配中出现的问题提出改进建议,为实现共享准备数据基础;(3)利用语义网技术和关联数据,以国家图书馆的人名规范数据为研究对象,根据关联数据的发布原则和流程,将其发布为关联数据,建立数据间的RDF链接,使数据能够克服异构障碍,进行跨系统的互操作,进一步实现图书馆内部数据共享及外部资源发现。