论文部分内容阅读
对当前实用的搜索引擎技术作了较为全面的综述,主要介绍了搜索引擎中较为核心的两大技术:信息采集及数据搜索技术,对当前较为先进和常用的相关技术进行了列举,并对各类技术的优缺点作了简要的比较及说明。特别对信息采集中网络蜘蛛的工能及原理进行了介绍,详细介绍了著名的互联网搜索引擎Google在数据检索方面所使用的PageRank算法,最后较为全面的给出了几种主要的中文分词技术。利用个别现有的著名搜索引擎实例对相关技术的实现进行了举例和说明。