论文部分内容阅读
通过对布隆过滤器算法误判率的分析和推理,得到最小误判率和最优散列函数个数,并且总结了误判率与输入元素大小n、位数组长度m和散列函数个数k的关系。分析了置信度为90%、95%、99%时误判率的置信区间,同时设置置信度为95%时,计算输入元素的规模大小分别为1e10(十亿级)、1e11(百亿级)、1e12(千亿级)时的位数组长度和散列函数个数。研究结果可为实际应用的数据集存储大小提供数据参考。