论文部分内容阅读
以OHSUMED语料库内提供的明确相关提问对为金标准和研究材料,借助BICOMB软件生成主题词-来源文献矩阵和共词矩阵,并获得各种系数的相似(相异)矩阵,对比分析目前国内基于SPSS共现聚类分析过程中主题词-来源文献矩阵与共现矩阵、各种相似性参数和各种类间距离计算方法的聚类效果。结果表明:主题词-来源文献矩阵聚类结果优于共词矩阵,在聚类分析中应优先选择。共词矩阵选择相似系数时应结合实际矩阵数据性质,并注意聚类方法原理上的正确性。