论文部分内容阅读
随着Internet网上的信息呈几何级数式的增长,搜索引擎已经成为用户浏览网络信息的首选。传统的通用搜索引擎(Google、Yahoo以及国内的Baidu等等),作为一个辅助用户查找信息的工具已经成为大多数互联网用户访问网络的入口。但是,这些通用性搜索引擎也存在着一定的局限性,如:通用搜索引擎的信息量过大、查询不准确、深度不够等问题。在这种情况下,为了解决这些问题,垂直搜索引擎应运而生。垂直搜索引擎是专注于某一行业或领域,满足行业专业需求、或者某项业务需求的专业搜索引擎,是搜索引擎的细分和延伸,是对某类网页资源和结构化资源的深度整合,并为用户提供符合专业用户操作行为的信息服务方式。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则更加专著、具体和深入。本文重点研究并剖析了这种新兴的技术。本文的主要研究内容如下:1.研究了垂直搜索引擎的由来,发展过程和应用现状。分析研究了传统的搜索引擎开发应用模型和搜索引擎的Web应用模型,对搜索引擎技术包含的关键技术进行了分析。2.阐明了Lucene技术,Heritrix技术,信息结构化提取技术的基本原理和使用方法,提出整合Lucene与Heritrix使其与J2EE平台完全融合的方案。3.实现手机产品垂直搜索引擎系统。