论文部分内容阅读
在开放存取理念背景下,机构知识库(Institutional Repository,简称机构库)已获得了长足的发展并受到国内外专家学者的关注。随着IR数量的不断增多,以及资源内容的快速增长,人们对实现IR之间数字资源共建与共享的需求表现得越发强烈。诚然,应该看到,目前我国多数机构知识库资源仍然处于孤岛状态,既对机构知识库内丰富的显、隐性知识资源缺乏科学有效的组织,也没有建立起机构知识库与机构知识库之间的有效关联,导致机构知识库资源难以被利用与共享检索。因此,如何充分利用机构知识库丰富的学术资源及其与整个信息环境的丰富链接,从广度和深度两个方面实现基于语义的机构知识库之间的知识关联,深入挖掘机构知识库资源内容的附加价值,是图书馆等信息机构提升知识服务能力、服务于新的数字科研面临的挑战与机遇。关联数据的应运而生及其在数字资源语义关联所具有的技术优势为机构知识库资源聚合与知识发现的研究与实践应用提供了技术支撑。将关联数据技术应用到机构知识库服务的实践中,探索基于关联数据的机构知识库资源聚合与知识发现服务的新业态就成为了本文研究的目标和努力方向。本文研究试图在以下三个方面取得突破:第一,构建基于关联数据的机构知识库资源多维度关联模式,阐释其形成机理。机构知识库资源的多维度关联与链接是知识交叉、融合、发现与创新的脉络线索,是机构知识库资源聚合与知识发现的基础与扩展逻辑,它可以为基于关联数据的机构知识库资源聚合与知识发现提供优质的数据资源。基于已有研究成果,本文从数据层的多维度关联和语义层的多维度关联视角,提出基于关联数据的机构知识库资源的多维度关联模式,阐述多维关联关系结构,关联数据协同本体的内在机理及其技术路线,以及本体对关联数据的正向作用。并通过实例阐释其在体现关联数据对机构知识库资源进行语义分析和实现多维语义关联中的重要作用。第二,凝炼并提出基于关联数据的机构知识库资源聚合的技术策略,构建关联数据的机构知识库资源聚合体系框架。关联数据的机构知识库资源聚合是综合运用分类主题词表、领域本体等知识组织工具,在规范化的概念语义体系与自然语言术语体系之间建立映射关系,通过知识提取、实体辨识、概念语义标注、语义知识关联描述,从而实现机构知识库资源聚合[1]。基于关联数据的机构知识库资源聚合策略是指实现机构知识库资源聚合步骤的科学安排。本文在分析并凝练基于关联数据的机构知识库资源聚合策略的基础上,提出基于关联数据的机构知识库资源聚合体系框架,描述了机构知识库资源聚合涉及的关键技术,并通过实验验证所提出理论模型的可用性,体现关联数据、本体模型等语义技术的可行性,为知识发现服务的应用提供支持。第三,提出基于关联聚合的机构知识库资源知识发现的体系框架。机构知识库资源的关联聚合及其发布为知识发现提供新的方法和思路。基于关联聚合的机构知识库资源知识发现是一个系统工程,应用目标是将富含语义的机构知识库资源聚合到关联数据网络中,挖掘和发现隐藏于数据网络中未知的、新颖的规则和规律,通过模式评价从中找出真正对用户所需有用的知识,与此同时以可视化的方式展示与利用。本文从知识发现的一般过程出发,延展到基于关联聚合的机构知识库资源知识发现过程,构建基于关联聚合的机构知识库资源知识发现模型。最后根据研究条件进行了机构知识库应用原型系统的开发,部分的实现了系统功能,验证了基于关联数据的机构知识库资源知识发现的价值。第四,提出机构知识库服务创新的策略及新动能数据驱动正在成为机构知识库服务创新的的一种价值观念和共同意识,作者认为,数据驱动下机构知识库服务创新的研究与实践探索必须坚持的四个面向,即面向更加复杂的数据网络环境,面向更加多样化的数据分析方法,面向更加精准化的用户需求和面向更加有针对性的结果呈现。面对数据驱动带来的挑战和机遇,机构知识库资源组织与服务需要有新突破、新发展、新价值;需要实现从单个机构为主的服务模式到机构之间协同服务,从机构主导到用户驱动,到IR知识发现服务平台。同时,要求我们重新思考机构知识库的核心能力和提升其社会贡献,积极探索和培育机构知识库服务创新的新动能。发挥数据驱动作用、充分利用基于数据的研究范式和在供给侧实现精准服务将成为促进机构知识库服务创新的新动能。