大规模中文搜索引擎的架构和设计技术

来源 :计算机科学 | 被引量 : 0次 | 上传用户:Jiangzi1125
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息检索技术已经发展了多年.然而,随着WWw的发展,网络信息空前膨胀.据2000年2月份统计,可索引的网页己达到10亿,而且每天以几百万速度递增.2000年6月份,索引的网页达到20亿[1].
其他文献
1引言传统的以太网架构,虽然已经被改进和增强以满足数据中心、高性能服务器的需要,但是由于它本身的带宽限制以及TCP/IP协议的高复杂性,产生带宽瓶颈,消耗服务器的大量CPU和
1 概述在分布存储多计算机系统中,消息传递是进程间唯一的通信手段,消息通信模型决定了并行计算的模型.一般情况下,通过对并行程序计算模型的描述来研究消息通信的模型.分布
1引言生物信息学中,对各种生物大分子序列进行分析是一件非常基本的工作,Paul A.Rota[1]通过测定SARS(又名非典型性肺炎)病毒的基因组序列,找到了含有制造蛋白质指令的部分基
一、引言随着社会信息化的不断发展和普及,Internet和无线移动通信技术的成熟,以及计算机处理能力的不断提高,新的业务和应用不断涌现,人们要求不仅能够在办公室和家庭等固定
1 引言个性化服务是指针对用户个人需求的不同,采取不同服务策略的一种个性化服务模式.个性化的健康服务体现在商品信息个性化和配送个性化两个方面.个性化信息服务可以在两
Almost all the important information is saved on physical media as files and managed by file system. Sofilesystem's security is an important promise to info
1引言对等计算(peer-to-peer,P2P)可简单地定义为通过直接交换共享计算机资源和服务,对等计算机兼有客户机和服务器的功能.虽然P2P这个术语是现在才发明的,但P2P本身的基本技