浅谈布隆过滤器在内容管理系统中的应用

来源 :软件 | 被引量 : 0次 | 上传用户:zgkjzh1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
内容管理系统的内容采集主要由爬虫进行搜集,但内容重复与否绝大多数情况下是根据内容所在的页面URI进行判定。作为一个完善的内容管理系统,必须具备对已有内容资源的识别功能。本文通过介绍布隆过滤器,并与传统的判重方式进行对比,同时改进布隆过滤器并应用于内容管理系统的资源判重的功能中,解决了内存占用无限增加,查询时间不断增长,记录内容无法删除等问题,实现了高效快速的资源判重。
其他文献
药物分析学是药学本科专业重要的专业课程之一,其研究内容通常是运用化学、物理学、生物学以及微生物学的方法和技术来研究化学结构已知的合成药物或天然药物及其制剂质量[1-
为了提高对MBR膜通量的预测精度,采用模糊径向基函数(RBF)神经网络建立网络预测模型,并采用改进的粒子群(PSO)算法进行优化。采用模糊推理过程与RBF神经网络所具有的函数等价性,
[目的]寻找适合白桂木基因组DNA的提取方法。[方法]采用改良的CTAB法及试剂盒法提取白桂木基因组DNA。用紫外分光光度法、琼脂糖凝胶电泳法检测白桂木DNA纯度、浓度,比较两种
Hadoop框架中基于缺额的公平调度算法以统一的固定配置设置定时计算和更新作业信息,在一定程度上影响了其作业调度的公平性,同时也不能满足作业的资源需求。针对基于缺额的公平
[目的]探讨早产儿桡动脉穿刺采血标准化操作流程对提高采血成功率的效果。[方法]早产儿72例(常规组)桡动脉采血按照常规的方法,77例(改良组)桡动脉采血按照通过品管圈质量管
超像素分割是目前用于遥感影像分割的研究热点,但它易产生过度分割的问题。为解决过度分割问题,提出一种简单线性迭代聚类(SLIC)结合快速FCM聚类算法(Fast fuzzy C-means,FFCM)的遥感图像分割方法。该方法首先用SLIC算法对初始影像进行预分割;然后使用FFCM对获取的超像素进行合并。本文将分形网络演化方法(FNEA)作为对比实验方法。实验结果表明,本文提出方法的分割结果与实际地
采用硝基甲烷还原.胶体负载法制备了粒径可控的系列高分散纳米Au/NaZSM-5催化剂.以多相CO催化氧化为模型反应,考察了Au微粒尺寸、pH值、反应温度、反应时间、焙烧活化温度以及Au