一种高性能分布式Web Crawler的设计与实现

来源 :上海交通大学学报 | 被引量 : 0次 | 上传用户：zjx1978_0901

【摘要】

：

介绍了一种大规模、高性能、分布式的Web信息搜集器的设计及其Java实现.提出了Crawler设计中数据结构、系统功能模块和相关算法新的设计思想;对设计与实现过程中需要解决的关

【作者】

：

张岭叶允明宋晖于水马范援

【机构】

：

上海交通大学

【出处】

：

上海交通大学学报

【发表日期】

：

2004年1期

【关键词】

：

Web信息搜集器分布式系统搜索引擎 Distributed parameter networksInformation analysisInformatio

【基金项目】

：

上海市重点基础研究项目

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

介绍了一种大规模、高性能、分布式的Web信息搜集器的设计及其Java实现.提出了Crawler设计中数据结构、系统功能模块和相关算法新的设计思想;对设计与实现过程中需要解决的关键问题分布式协调机制、基于内存的URL存储管理等进行了讨论,并提供了现阶段的设计、实现方法和分布式无损链接分析算法.

其他文献

当代戏剧影视人物造型设计的美学风格探析

当今社会,随着人们生活水平的不断提高,对物质生活要求亦是不断增加,且更加丰富多彩。因此,观众在视觉上对影视人物造型设计的要求也是越来越高。影视艺术就是通过导演构思、

会议

影视人物造型设计美学风格

山东省小麦白粉病发生消长规律的研究

本文根据山东省小麦白粉病发生情况50a数据资料,分析了白粉病发生消长规律及其消长原因,并对其未来发生趋势进行了分析预测。

会议

小麦白粉病消长规律原因分析预测

浅谈《卫生管理运筹学》的教学改革与探索

《卫生管理运筹学》是以运筹学为体系框架,借助运筹学的理论方法 ,研究医药卫生系统最优化问题的一门课程,该课程为新疆医科大学卫生事业管理专业学生的核心课程。其通过建立

期刊

卫生管理运筹学课程改革计算机辅助教学

基于一类分类法的不良信息过滤模型

针对网络不良信息过滤中训练样本分布不均衡,负面样本对于训练效果无充分贡献,提出了一种利用正面训练样本建立分类模型,并基于该模型实现网络不良信息过滤的方法.模型通过选

期刊

互联网信息安全不良信息过滤一类分类法Internet information security malicious information filter

当代戏剧影视人物造型设计的风格分析研究

人们生活水平的提高,使得人们对于精神文化的要求越来越高,使得影视行业的发展越来越快速。影视行业发展至今,其丰富的影视作品越来越受到大众的喜爱。戏剧影视作为由多种艺

会议

戏剧影视人物造型设计风格

以人为本，创建生态文明校园——福建省泉州第一中学生态文明教育纪实

<正>泉州一中是福建省首批办好的九所重点中学之一、省一级达标学校、省首批"示范性普通高级中学"、省首批"高中新课程实验样本校",第十一届、十二届福建省文明学校、现代教

期刊

生态文明教育生态文明建设生态文明校园垃圾分类福建省以人为本

牟氏庄园饮食文化初步研究

山东栖霞牟氏庄园是中国北方规模最大、全国保存最完整、最具典型意义的封建地主庄园,其饮食文化在国内独树一帜,体现了胶东半岛鲁菜文化特色。本文力图从饮食特色、特色菜肴

期刊

牟氏庄园庄园菜成因营养特色the Mou＇s manor the manor＇s dishes causes nutrition

一种高性能分布式Web Crawler的设计与实现

其他学术论文