论文部分内容阅读
近年来在信息检索领域研究人员提出了多种支持结果多样化的排名算法,但还没有相关文献对这些算法的性能进行系统的分析和比较。为此,在数据融合排名算法Comb Sum的基础上,提出一种同时考虑文档相关性和多样性的排名算法Comb Sum Div,并将其与x Qu AD和PM2这2种显式排名算法进行性能比较。在TREC多样性任务提供的查询数据集和Clue Web09B数据集上的实验结果表明,Comb Sum Div查询性能较优、x Qu AD次之、PM2较差,且3种算法均具有较强的稳定性及抗干扰能力。