一种基于Kademlia的全分布式爬虫集群方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:tingchao12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对将海量爬虫节点组织成全分布式爬虫集群所遇到的高效、均衡、可靠、可拓展等问题,提出了一种基于Kademlia的全分布式爬虫集群方法.该方法通过改进的Kademlia技术建立起爬虫节点间的底层通信机制.在此基础上,根据Kademlia的异或特性及节点的可用资源情况,设计并实现具有任务划分、异常处理、节点加入退出处理及负载均衡的全分布式爬虫集群模型.在实际网络系统上的实验结果表明,该方法能有效利用海量弱计算终端的计算、存储和带宽资源,构建高效、均衡、可靠、可大规模拓展的全分布式爬虫集群.
其他文献
电子发票异军突起,给传统会计档案管理带来管理性的变革,虽然业界对电子文件管理有着较为成熟的研讨和应用实践,但鉴于电子发票这一电子会计档案的特定凭证性、参考性和法律
本文通过对军工单位纸质档案数字化加工的调研,对涉密单位特别是军工单位在纸质档案数字化加工中存在的困惑进行了分析,提出适合纸质档案数字化的方法,同时阐述了军工单位纸
随着计算机技术、通信技术、网络技术的应用与普及,电子档案应运而生,电子档案的生成、传递、归档、整理、立卷、保管、利用等各环节存在诸多安全隐患。本文分析了影响电子档案
小博单位前两天来了一个推销消防器材的人,专门为我们档案部门介绍了一款新型灭火器,小博感觉挺有意思的,在这里和大家介绍一下。这款新型灭火器就是“悬挂式液体自动灭火装
小博在做管理咨询的时候,有客户提出来能否将档案进行封装。说实话,小博之前没有接触过档案封装,脑袋里对封装的理解还停留在超市酱肘子的真空包装上,但是专业的直觉告诉我档
在动态背景下的运动目标检测中,由于目标和背景两者都是各自独立运动的,在提取前景运动目标时需要考虑由移动机器人自身运动引起的背景变化。仿射变换是一种广泛用于估计图像间背景变换的方法。然而,在移动机器人上使用全方位视觉传感器(ODVS)时,由于全方位图像的扭曲变形会造成图像中背景运动不一致,无法通过单一的仿射变换描述全方位图像上的背景运动。将图像划分为网格窗口,然后对每个窗口分别进行仿射变换,从背景变
针对线性系统中系统误差对状态估计精度造成的不利影响,在卡尔曼滤波算法框架下提出一种基于系统误差和状态联合估计的目标跟踪算法。在算法实现过程中,首先定量分析了系统误差对目标状态估计及其估计误差协方差矩阵的影响,进而结合状态扩维技术构建系统误差配准的实现过程,最终依据标准卡尔曼滤波迭代流程设计了算法实现步骤。仿真实验结果表明:在系统误差恒定和时变两种情况下,新算法在系统误差配准和状态估计上具有可行性和
针对产业链协同SaaS平台企业群以盟主企业为核心的业务流定制过程中的流程规则编排、存储/访问以及执行控制3个环节可能存在的安全隐患,建立了基于数字签名及业务实例关联的业