一种高性能分布式Web Crawler的设计与实现

来源 :上海交通大学学报 | 被引量 : 0次 | 上传用户:zjx1978_0901
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
介绍了一种大规模、高性能、分布式的Web信息搜集器的设计及其Java实现.提出了Crawler设计中数据结构、系统功能模块和相关算法新的设计思想;对设计与实现过程中需要解决的关键问题分布式协调机制、基于内存的URL存储管理等进行了讨论,并提供了现阶段的设计、实现方法和分布式无损链接分析算法.
其他文献
当今社会,随着人们生活水平的不断提高,对物质生活要求亦是不断增加,且更加丰富多彩。因此,观众在视觉上对影视人物造型设计的要求也是越来越高。影视艺术就是通过导演构思、
本文根据山东省小麦白粉病发生情况50a数据资料,分析了白粉病发生消长规律及其消长原因,并对其未来发生趋势进行了分析预测。
《卫生管理运筹学》是以运筹学为体系框架,借助运筹学的理论方法 ,研究医药卫生系统最优化问题的一门课程,该课程为新疆医科大学卫生事业管理专业学生的核心课程。其通过建立
针对网络不良信息过滤中训练样本分布不均衡,负面样本对于训练效果无充分贡献,提出了一种利用正面训练样本建立分类模型,并基于该模型实现网络不良信息过滤的方法.模型通过选
人们生活水平的提高,使得人们对于精神文化的要求越来越高,使得影视行业的发展越来越快速。影视行业发展至今,其丰富的影视作品越来越受到大众的喜爱。戏剧影视作为由多种艺
<正>泉州一中是福建省首批办好的九所重点中学之一、省一级达标学校、省首批"示范性普通高级中学"、省首批"高中新课程实验样本校",第十一届、十二届福建省文明学校、现代教
山东栖霞牟氏庄园是中国北方规模最大、全国保存最完整、最具典型意义的封建地主庄园,其饮食文化在国内独树一帜,体现了胶东半岛鲁菜文化特色。本文力图从饮食特色、特色菜肴