论文部分内容阅读
索引表求交是搜索引擎中一个重要的操作,先前的研完工作主要集中在单核心或者多核心的CPU上。这篇文章提出了一种新颖的利用Bloom Filter的近似索引表求交算法。尽管Bloom Filter会返回误称结果,发现错误的结果数相对求交结果非常少,并不会影响结果质量。本文的方法是基于一种批次的GPU处理框架,在这种框架中,查询在CPU端组织成为一个批次,并在GPU端进行处理,这个框架有效地利用了GPU的大规模并行运算能力,可以有效地提升系统的吞吐率;实验显示,本文提出的Bloom Filter求交算法相比基准的二分搜索方法的性能有了显著的提升,且结果的冗余率非常低。