论文部分内容阅读
基于后缀树结构与向量空间模型来设计西文二次文献的文献相关性判定算法。给出了文献相关性判定的流程,分析了后缀树算法的优势,并采用后缀树算法抽取特征项建立向量空间模型。与基于词的向量空间模型相比,基于后缀树的文献相关性判定算法在理论上有利于降低向量空间的维数,避免产生高维问题,并且基于后缀树模型的文献相关性算法独立于语言种类。