论文部分内容阅读
本论文结合语义网技术与网格技术来解决数字图书馆领域中分布式异构系统的互操作问题。为了实现分布式异构系统的远程合作,实现海量信息资源的分布式存储,实现数字图书馆资源的最大化共享,文中提出利用语义网格技术构建数字图书馆虚拟组织的构想,参照网格技术中工作流思想将网格上的Web/grid服务协调组织起来完成网格用户的需求,同时采用语义网中的本体技术来描述服务与资源的元数据以增强服务与资源的互操作性,并设计实现服务查找框架来自动查找、组合、调用与监控这些服务和资源。文中将要详细介绍基于网格的OWL-S/UDDI服务查找框架,它是作为服务提供者与服务消费者的中间代理,在服务消费者和提供者间进行映射,根据服务消费者请求为其提供最匹配的服务。文中改进了传统的服务匹配算法,从语境、服务功能、服务质量和服务分类4个方面来筛选服务。最后,文中将该服务查找框架应用在数字图书馆的基础架构模型Hbutigrid的开发设计中。为了实现Hbutigrid,文中首先利用Globus工程的技术在Linux服务器上搭建网格平台,利用Introduce工具自动生成与发布Web/grid服务,并利用网格集群监控工具Ganglia监控网格上服务与资源的宿主机的工作状态。同时,为了给OWL-S/UDDI服务查找框架提供一个语义环境,文中采用OWL本体描述语言模型来设计领域本体,利用基于OWL语言的web服务描述模型OWL-S来扩展服务描述文档WSDL的元数据信息以方便服务检索,最后使用Jena工具对本体文件进行语义推理,以获取语义服务的信息。最后,文中基于OWL-S/UDDI服务查找框架实现了基于本体的数字图书馆检索服务。为了提高其资源检索的准确性,采用中科院分词工具ICTCLAS3.0对用户输入切词以获得有意义的词,将《中国分类主题词表》转化成本体文件,并结合TF-IDF算法自动对文献分类,将网格上的数字图书馆检索服务按其能提供的资源的学科领域进行分类,以进一步提高服务匹配框架的精确度。