论文部分内容阅读
分面组配的分类思想在网络信息资源组织中日益显示出它的魅力,雅虎作为一个典型的目录索引式搜索引擎,分面组配的原理在整个信息资源组织过程中体现的淋漓尽致。文章从冒号分类法的角度对雅虎分类进行了全面的探讨。
首先,文章介绍了冒号分类法的分类原理、一些基本概念及规则。这些概念及规则,在下文的论述中将发挥重要的作用。
其次,文章剖析了Yahoo分类体系的优点与不足。Yahoo作为指南型搜索引擎,具有按主题建立分类索引,关键词检索与分类浏览相结合,建立了多重划分、多元展开的类目结构,横向关系重复揭示等优点。同时也存在着知识领域不全,知识体系不严密;类目之间的逻辑关系混乱,上下位类隶属关系不清,同位类界线不明确;按照类名字顺排序不能反映并列类目之间的联系,缺乏对知识门类系统显示的能力和揭示类目相关性的作用;横向关系的揭示形式单一等不足。
笔者通过仔细研究发现Yahoo分类体系与阮冈纳赞的冒号分类法之间存在着某种惊人的相似,于是分别从冒号分类法的三个结构平面——概念平面、词语平面、标记平面,索引,标记公式等几个方面探讨了两者之间的相似性。世界上没有完全相同的两个事物,尽管冒号分类法与Yahoo分类体系之间存在诸多的共性,毕竟Yakl00是现代网络技术下的产物,分类对象是海量的、动态的、变化的、纷杂的网络信息资源,它的分类体系又不完全等同于某个传统分类法,它有其独特性。文章又研究了Yahoo分类体系与冒号分类法的不同之处,分析了两者产生差异的原因。
在上述研究的基础上,论文以冒号分类法为主要理论依据,结合中图法,对Yahoo分类体系提出了新设想,主要内容涉及分类大纲的新设想,在新体系里增加类似通用焦点的大类,并列类目的排序坚持主题和字顺结合的原则,用符号“”解决类目之间交叉关系,在某些主题领域建立分面叙词表等。
最后,文章参考美国情报学家Lancaster基于传统的信息检索系统提出的信息检索评价标准,在综合国内外学者研究的基础上,提出了英文Yahoo检索性能评价指标。在论述过程中,笔者以实例和实验数据为论据,比较全面地对雅虎的检索性能进行了评价。