论文部分内容阅读
叙词表是一部有关规范化词语和词间关系的多语种的受控词表,是一种基于语义的知识组织工具。图形作为一种信息表示和传递方式,具有文字所没有的形象直观的优点。近几年,采用图示、图形、图像对数据信息和知识进行可视表示成为研究热点。信息可视化技术用于叙词表的过程就是叙词表词间关系可视化。借助信息可视化技术,信息可视化快速进入基于网络的图形动态可视化阶段。作为知识组织工具,叙词表的可视化进展略显落后,只是从传统图形显示发展到电子版和网络版式叙词表的等级树,动态图形可视化研究还处于实验阶段。本文对应用于数字图书馆和网络的信息可视化和叙词表可视化的研究进行概述。目前叙词表动态图形显示还处于论文研究阶段,主要是采用本体和主题图工具实现可视化,也没有一套评价指标体系评价和比较这两种知识组织工具。本文的任务之一就是构建一套评价体系,比较研究两种可视化工具。工具选择的是本体工具Protégé、主题图工具Ontopia的知识套件和单独的可视化工具TMNav。由于目前的叙词表可视化研究工作并未对可视化后的结果进行分析研究,,所以为了保证评价样本数据的真实性和可靠性,必须先进行具体的可视化实现过程,可视化过程采用同一叙词表,使得三次可视化具有可靠性和可比性。可视化对象是一部机编中国画词表,这部主题词表结合《中国分类主题词表》和《中国美术辞典》采用五原则编制收录677个词语,包含四大类15个子关系。将这些关系进行技术转换映射到本体和主题图,通过可视化插件或工具获得三种不同的视图,证明了本体和主题图的可视化工具适合新型叙词表的可视化。评价指标体系的构建分为三个步骤:第一步是提取评价因子,第二步是确定评价重要性数值和权重系数,第三步构建出整个指标体系。第一步是建立在对已经用于数字图书馆和网络的信息可视化系统的综合分析,传统图形显示的表现方式,以及具体的叙词表可视化过程的研究基础上的。从样本库中选取适合评价的因子。第二步,用所研究的参照系统给每个指标赋值,表示其重要性,统计求和得到指标的重要性数值,再要据重要性数值在总数值中的比值确定权重系数。最后一步将各级指标组织成系统的三级评价指标体系,形成有3个一级指标、11个二级指标、37个三级指标。应用时,确定评价标准和标准值,对本体和主题图可视化工具给出评价值,采用加权平均算法得到最终数值。根据评价结果,分析比较三种可视化工具。文章的最后一部分讨论了叙词表可视化应用于图书馆的意义和可行性。在吸取之前研究比较中的精华,设计图书馆检索结果可视化的用户界面和系统功能。