论文部分内容阅读
基于语义的搜索引擎属于知识组织方面的研究,是数字图书馆领域的一个研究热点,也是图书馆在线应用方面的一个热点课题。它代表了搜索引擎的发展方向。而对于中文搜索引擎来说,因为有着对于中文处理方面的具体问题,这方面的工作目前尚处于探索阶段。
本文在系统掌握中外同行对该项课题大量研究成果的基础上,以“图书馆使用的角度看搜索引擎”为研究视角,并采用了文献调研、分析综合、定性定量相结合等方法,对基于语义的搜索引擎作了较为系统的分析研究。首先将基于语义的搜索引擎与传统的搜索引擎作了比较;在此基础上,接着对基于语义的搜索引擎构造的相关技术如分词技术、短语识别技术、语义词典及知识库、本体、相关性算法作了探讨,然后对基于语义的搜索引擎的体系结构、基于语义的搜索引擎的个性化服务及其运作,基于语义的搜索引擎在信息检索、自动问答系统、信息服务等领域的应用等均作为着重内容进行了研究,并在研究它对图书馆业务工作的影响上提出图书馆的应对策略。
文章还分析了目前该领域研究中存在的问题。本文研究认为汉语分词歧义词处理的方法还有待改进;知识库的构建不能只停留在词表或只对词表进行改造的层次,各领域的专家要联合起来构建基于本体的知识库。此外,各专业领域的知识库不断建立,它们之间特别是关系密切的若干库之间该如何“兼容”也是本课题应研究补缺的问题之一。要建设简单实用的语义型信息检索模型,应考虑怎样对各种模型进行融合及取长补短。