论文部分内容阅读
面向商品的购物搜索引擎是一种分类精确、更新快速的垂直搜索引擎,购物引擎提供多样化和个性化的购物搜索功能,为满足广大消费者针对性的购物资讯需求,盘古搜索公司成立了商品搜索小组。盘古商品搜索小组以垂直搜索为研究背景,运用了当今比较流行的垂直搜索理念和技术,将国内互联网的商品信息作为爬取对象,使用全文搜索工具包Lucene,设计并实现了面向商品信息的垂直专业化的搜索引擎。论文主要的研究工作是:(1)研究了基于商品搜索的系统实现技术,在系统的实现上和关键技术难点上,分析了搜索引擎与垂直搜索引擎的相同和不同点。深入了解了Lucene的代码和关于Lucene全文检索等相关技术。(2)确定了系统的基本功能和目标,它们是商品信息的有效搜索功能、系统实时索引功能、搜索效果反馈的优化功能。(3)分析垂直搜索主流技术,研究垂直搜索系统的表现层、逻辑层、数据层架构思想,详细论述了系统的功能设计。(4)面向商品垂直搜索系统的设计。深入了解面向商品搜索引擎的关键技术,这些技术包括网页信息的采集技术、对商品信息的提取和组织技术、建立相应的索引库技术和实时索引技术,明确系统的总体架构工作流程、系统总体层次架构和各个功能模块的设计。(5)实现了垂直搜索的四大模块,购物资讯引擎的信息抓取模块、购物资讯引擎的数据(网页/商品)处理模块、购物资讯引擎的建立标准库模块、购物资讯引擎的商品分析模块。在工作成果方面,抓取多项数据源并保持数据信息的统一性,实时索引技术,根据新词、热词反馈到系统和基于用户行为的智能推荐技术等方面是系统的工作亮点。本文所研究的购物资讯引擎不仅具有重要的理论意义,还对垂直购物的发展有一定的实用价值。希望论文能对购物资讯引擎的多样性和个性化发展有所贡献。