论文部分内容阅读
在信息检索过程中,由于文档中存在大量的多义和近义现象,导致不确定性出现,这将影响检索的性能。为此我们采用信息熵和粗糙集理论来处理这类不确定性问题。首先计算训练文档集中的词之间的信息熵,对信息熵做模糊聚类来构造词之间的等价关系,然后借助于该等价关系提出并实现了一个以粗糙集上下近似为基础的信息检索模型,通过实验的测试,该模型能够提高信息检索的效率。