论文部分内容阅读
信息检索语言是表达一系列概括文献情报内容的概念及其相互关系的概念标识系统,其职能是作为信息检索系统的语言保证,检索语言的质量直接影响着检索系统的效率。 目前,网络信息检索工具主要是基于范畴层次(List-based Search Engines)的搜索引擎和基于语词层次(Words-based Search Engines)的搜索引擎。著名的浏览型网络信息检索工具如Yahoo、Eblast、Galaxy和大部分综合型搜索引擎实际上都是自觉或不自觉地借鉴了传统情报检索语言组织和揭示信息的思想,Altavista集成的Askjeeves就是自然语言搜索引擎。传统检索语言经过网络适应性改造后,能够成为目前及将来相当时期内最主要、最重要、最有效的网络信息资源组织的方法,依然能为网络信息检索提供语言保证。 在手工检索、机检条件下形成的受控语言从标引到检索两方面都已基本成熟,网络信息资源的组织与检索涉及到自然语言如何与受控语言兼容并蓄问题。受控语言与自然语言相结合,共同用于组织和检索网络信息应该是未来信息检索语言的发展方向。本文力图通过对近年来国内外针对网络环境下信息检索语言理论及应用性成果的研究,展望这一领域研究前沿与发展趋势。 本文主要研究网络环境下信息检索语言的发展,主要内容包括五部分: 第一部分分析了网络环境对信息检索语言的影响;第二部分是网络环境下分类检索语言的应用,包括传统分类法电子化及在网络上的应用,网络信息检索工具中的应用;第三部分是网络环境下主题检索语言的应用,包括传统叙词表电子化及在网络上的应用,在网络信息检索工具中的应用;第四部分是自然语言处理与自然语言检索,包括自然语言处理的基本原理及在信息检索中的应用,国内外自然语言检索进展;作者在论文最后指出,在网络环境下信息检索语言新发展有:元数据研究;分类-主题-自然语言一体化,分析国外一体化系统实例:一体化医学语言系统UMLS,国内一体化系统实例:《中国财经报刊数据库》检索系统;并指出学科—事物概念组配型检索语言是理想发展模式。