数字图书馆元数据组织和互操作研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:qhjxiaofeitian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字图书馆作为第二代Internet的关键基础设施,近年来取得了快速的发展。面对海量的、异构的数字资源仓储,帮助用户准确有效地找到所需信息成为重大挑战之一。 元数据是“关于数据的结构化数据”,为数字图书馆提供了一种精确描述数据内容、语义和服务的机制。在资源建设方面,元数据作为定义和组织数字图书馆信息资源的基础,起着重要作用。因此,元数据管理(包括元数据自动抽取、元数据语义标注和语义检索等)是重要的研究课题。 数字图书馆间的互操作是服务集成的基础。简单地说,互操作代表了数字图书馆各个组成部分独立地演变和方便有效地互相调用的能力。数字图书馆之间的互操作包含两个层面,一是数据级别的互操作,二是服务级别的互操作。 数字图书馆服务集成依赖于元数据组织和服务互操作,这是数字图书馆研究和发展的关键问题。本文的主要贡献可以概括为以下三个方面: 1.定义了基于语义网理论的元数据语义信息模型DLOnto,该模型建立在中图分类主题词表资源本体和WordNet基础之上。提出了基于DLOnto的查询扩展和语义相关度算法,该算法应用于元搜索的结果排级和数字图书馆的语义排级都取得了很好的效果。 2.提出了结合SVM和二元HMM自动抽取科技文献元数据的方法,利用双弯曲线函数把SVM分类结果拟合为二元HMM模型的单词发射概率,再采用二元HMM模型对SVM分类结果进行校正。实验表明,本文的元数据自动抽取理论和方法非常有效。 3.提出了支持OAI-PMH和Web服务的互操作框架。支持OAI-PMH选择性收割协议和基于元数据本体MetaOnto元数据互操作,支持基于OAI-PMH和WSRF的元数据同步,支持基于OWL-S语义描述的Web服务进行服务集成和元搜索。 在PKUSpace中的相关实验表明,本文提出的元数据组织和基于互操作进行服务集成的理论和方法是行之有效的。为数字图书馆资源语义组织,元数据自动标注,异构数字图书馆数据和服务集成提供了切实可行的解决方案,最终帮助用户准确有效地找到所需信息。
其他文献
  本文对基于硬实时操作系统RTLinux的数控系统进行实时性能方面的评测及相关问题进行了研究。不仅为数控系统提供稳定、安全、可靠的运行环境,而且为实时应用的研究与开发
本文针对用户对文件检索的需求,在文件检索技术领域有如下贡献。 1.首先提出了一个文件检索的模型,明确了在文件检索模型中检索对象、查询串、查询与检索对象的匹配方式三部
本文结合实际开发的印前人民币钞纸在线检测系统,对钞纸票面质量与防伪标记检测技术及相关算法进行了研究与探讨.文章首先结合系统的目标需求及总体设计,对印前钞纸在线检测
传统金融市场的技术架构,是高度一体化的封闭系统,早已不适应发展的需要。互联网出现后,在线交易、支付和结算成为基本趋势,但普遍存在的安全威胁成为网络化的主要障碍。与普通电
近年来,基于策略的网络管理PBNM(Policy Based Network Management)由于具有能够有效地简化和自动化网络管理等优点,得到了较快的发展。但是任何运行良好的PBNM系统必须具有
  本文对电子政务应用系统的发展背景、目标和意义进行了论述,阐述了在电子政务系统中政务信息管理系统的内容、地位和作用。在分析了现有系统实现的问题与缺陷后,提出了利用
中药材成分复杂性、批次间存在较大差异等因素严重影响了中药产品的质量稳定性和均一性。为了有效解决这一问题,则必须实现对药物体系中化学成分的直接控制。以在线近红外光
随着网络技术的迅猛发展,网络的规模越来越大,结构越来越复杂,传统的网络管理系统已经无法满足现代网络管理的需求。为了保证网络的运行效率和性能,新一代网络管理系统的开发
因特网由雏形ARPANET的时代发展至今,网络技术和网络应用的发展突飞猛进,除了普通的网页浏览行为之外,网络在经济方面也承担了越来越重要的角色,像网上银行、购物网站这些新生事
当今信息社会,Internet信息访问、办公自动化、多媒体技术和大型电子商务广泛应用,每时每刻地产生着大量的计算机数据。这种数据成几何级数增长,极大地推动了存储技术的发展。网