论文部分内容阅读
在信息资源不断丰富,甚至已经称之为“信息爆炸”的今天,获取有用的信息或者知识却越来越难;拥有如此丰富的知识财富,让我们越来越迷失在知识的海洋中。目前的信息检索系统返回检索词的结果数量巨大,而用户所需要的仅仅是其中很小一部分,遍历每一个检索结果去寻找,费时费力效率低下。造成这种结果的原因就是用户所输入的检索词与论文作者在论文中展现的元数据信息之间没有客观联系,用户往往是在“猜”作者用的是什么关键词,单位是否用了别名等等。检索词和事实元数据都没有统一规范的标准,这就造成了两者直接存在偏差,从而导致了检索的不精确。知识导航系统提供了一种全新的检索思路,从事实出发,挖掘元数据间的关联关系,不断限定检索范围,最后提供精确检索。
论文的主要成果包括:
1)提出了基于WebServices的知识导航系统的总体设计框架,详细介绍了系统设计原理、数据源选取、数据处理过程、知识库的构建、导航系统逻辑框架以及导航算法等关键模块的详细设计过程。
2)论述了在Internet环境下基于WebServices进行知识导航时需要解决的问题:如何对海量数据进行高效的挖掘和处理,如何对元数据进行组织以及对哪些元数据进行组织,如何在导航系统中扩展用户的检索需求以理解用户真正的检索意图,如何与知识库进行交互从而保证导航系统的效率和跨平台性。
3)构建了知识导航系统的原型系统,系统采用RMS(ResourceManagementSystem)资源库构建知识库,包括人物、机构、学科、关键词、基金五个知识库;系统选取万方中文学术期刊论文数据库、学位论文数据库和会议论文数据库为基础数据库进行聚类挖掘;该系统采用提供SOAP标准的数据接口(XML),可用于任何目标系统进行知识导航;开发了基于AJAX具有输入渐进提示功能的检索框和关联知识导航算法;系统使用J2EE平台,利用OpenURL+CQL提交精确检索表达式,实现与目标系统的无缝结合。
4)最后对论文工作进行了系统的总结和展望,指出了系统中存在的不足和待改进的地方,并展望了基于WebSerrices的知识导航系统在学术信息检索领域中广阔的应用前景以及在情报界的其他应用。