论文部分内容阅读
本文介绍了基于向量空间的信息检索方法,检索词和文件之间的关系表示成一个矩阵,查寻信息表示为检索词权重的向量,通过求查寻和文件向量的夹角余弦确定出数据库中的相关文件.使用矩阵的QR分解和奇异值分解(SVD)来处理数据库本身的不确定性,本文的目的是说明线性代数中的基本概念可以很好解决信息检索(IR)问题.