论文部分内容阅读
书目搜索是数字图书馆的基础服务之一,但是随着移动互联网的发展与网络数据量的不断累积,已有的书目搜索系统越来越难以满足用户的需求。从搜索结果来看,当前书目搜索系统的搜索结果都是使用MARC进行组织的一维线性数据,语义化与关联程度低,不利于用户的资源发现。从搜索形式上看,当前的书目搜索系统基本是传统的文字输入型搜索,并且大多数系统都没有对搜索页面进行移动端适配,从而导致移动网络用户的搜索操作非常不便。关联数据与移动视觉搜索为数字图书馆革新书目搜索服务提供了新的契机与思路。基于此,本文以移动视觉搜索与关联数据为核心,围绕搭建数字图书馆书目资源移动视觉搜索平台展开研究,以期帮助数字图书馆提升书目搜索服务质量。本文首先通过文献调研梳理了书目信息关联数据化处理与数字图书馆移动视觉搜索相关的研究现状,然后对关联数据和移动视觉搜索的相关概念及关键技术进行整理与介绍,作为后续平台实现部分的技术基础。然后以关联数据与移动视觉搜索为核心提出了一个数字图书馆书目资源移动视觉搜索平台框架并对框架的组成部分进行介绍,该框架融合了关联数据和图像处理与检索技术,支持以视觉资源为对象进行语义信息和关联资源的搜索。最后以书目封面搜索为例对本文提出的框架进行实现并通过实验进行测试。本文的主要研究贡献体现在:(1)分析了当前数字图书馆书目搜索平台存在的问题,为书目搜索平台的建设提供了发展方向:首先要以关联数据为核心实现搜索结果语义化,通过对书目信息进行重新组织并以关联数据的形式进行发布,而为用户提供语义化与关联化的结果数据。同时以移动视觉搜索为核心丰富搜索入口与搜索形式,这要求数字图书馆构建起书目资源的视觉资源库,并为用户提供图像对象的搜索入口和搜索功能。(2)提出了一个数字图书馆书目资源移动视觉搜索平台框架,该框架代表一个搜索平台的完整体系,共包含四个层次,各层次职责明确、相互配合,能够对构建书目资源移动视觉搜索平台的实际工作提供借鉴。(3)对提出的平台框架进行完整的实现,是对构建数字图书馆移动视觉搜索服务的实际工作进行的试验性探索,具体工作包括书目信息及封面图片抓取、封面图片视觉特征数据库的建设、书目信息关联数据库建设、封面图像匹配与搜索、书目语义信息展示等。本文的不足主要体现在搜索平台的实现部分:对于移动视觉搜索的实现,受数据来源的限制,封面图片视觉资源的质量较低,图像的匹配准确性还有待提高,并且无法验证在大数据量情况下搜索系统的响应速度;此外,由于通过豆瓣图书API抓取到的书目元数据字段较少,因此构建的书目本体模型描述能力不足,同时目前只实现了内部数据之间的关联,与外部资源的互联还有待实现。