论文部分内容阅读
元数据是关于数据的数据,是数字资源揭示和利用的基础。DC (Dublin Core)元数据作为通用的元数据标准是目前国际上最有影响的元数据格式。随着DC元数据应用环境的变化,一方面,原先单纯的都柏林核心元数据集已无法满足新的应用环境,无限制的扩展核心集加深了DCMI (The Dublin Core(?) Metadata Initiative)的维护成本及管理难度;另一方面,随着语义网技术的发展,由于不同的领域甚至同一领域往往存在多个元数据格式,而用不同元数据格式描述的资源体系之间进行检索、资源描述和资源利用时,就会存在元数据的互操作性问题(Interoperability)。从DC元数据标准规范体系的范畴来看,以上涉及问题仍处于DC 1.0的体系范畴。随着DCMI越来越关注元数据与语义网的关系,关注元数据之间的互操作及元数据的开放性服务,DC 2.0标准规范体系正随着2007年新加坡框架(Singapore Framework)的提出逐步完善规范。早期DC会议探讨元数据应用中的语法和结构问题,96年提出了Warwick框架作为元数据应用的一般“容器”和概念框架,97年3月DC会议确定了限定版DC,即对DC元素的语种描述、模式体系和属性类型三个方面进行限定和扩展。DCMI从2003年开始探讨研究DC元数据抽象模型(DCMI Abstract Model, DCAM), DCAM明确地定义了DC元数据描述所使用的概念、术语词汇类别及其相互关系以及DC元数据描述记录的基本结构。同时从近几届的DC年度国际会议来看,DCMI一直在探讨如何能更好的描述数字资源,如何才能更好的实现元数据的语义互操作等问题。07年DC元数据年会提出的“新加坡框架(Singapore Framework) ",即DC元数据应用纲要用以设计元数据应用的框架,以帮助设计的元数据获得最大程度的互操作性,同时通过这一框架使这样的设计文档尽可能被重用。新加坡框架定义了一系列描述组件,描述了这些描述组件所依据的标准规范与标准应用的领域模型及语义万维网的基础标准之间的关系,这些描述组件对于一个应用纲要或是必须的或者是有用的。新加坡框架提出了一个完整的框架,为元数据应用纲要的标准化提供了一个很好的理论基础,解决了“元数据规范体系包括哪些部分,各部分的相关关系是什么”的问题。本文主要将新加坡框架体系的最新研究进展与国际上应用新加坡框架的元数据应用纲要的实践项目情况相结合,从理论研究体系与实践应用中的具体情况分析中着手进行新加坡框架下的元数据服务研究。通过对早期DC1.0逐步发展为DC2.0的发展背景的梳理,尤其是关注DC2007, DC2008, DC2009三年DC元数据年会国内外元数据研究所取得成果及发展方向,把握元数据所具有的本质与特点,同时结合参会各方所提出的设想与方案提出自己对DC2.0元数据规范体系的认识,特别是系统综述新加坡框架体系理论,明确了什么是元数据应用纲要,应用纲要的基础与具体内容。通过对为何要提出元数据应用纲要的理解与明确应用纲要可以解决哪些问题的探讨,提出对新加坡框架体系中DC元数据应用纲要及抽象模型的思考与看法,也形成了本文如何研究应用元数据应用纲要的研究方法。本文通过对国外最新元数据应用纲要实践项目Dspace环境下的Dryad仓库和SWAP项目的案例分析,结合国内元数据的应用情况,对国内将来应用元数据应用纲要和目前一些元数据系统在互操作上存在的问题提出一些相应的建设性意见与解决思路。在开放关联的数据服方面,以瑞典国家图书馆“将图书馆书目纳入语义万维网”为例详细深入探究分析研究,探讨元数据映射问题,如何支持各主要资源描述型元数据方案的相互映射。为元数据模型的实现,满足资源描述、存储、互操作、检索、分布式知识发现等各相关构件或模块对元数据模型提出的功能需求。同时本文也在新加坡框架体系下以一定篇幅探讨DC元数据在社会性标签中的作用。在最后基于新加坡框架下的研究基础探讨了元数据服务的现在以及未来的发展趋势,涉及未来DC元数据在数字图书馆的互操作,未来DC元数据去图书馆化的社会应用,进一步深入探讨基于本体的元数据转换与语义关联技术等方面的内容。