论文部分内容阅读
随着Web技术的发展,Internet已经发展成为一个巨大的全球化信息空间。在这种情况下,用户面对浩瀚的信息海洋,往往无法准确找到自己所需要的信息。传统搜索引擎的出现在一定程度上解决了Web信息检索困难的问题,但是,由于不同的搜索引擎所采用的算法和搜索范围各异,导致返回结果的重复率不到34%。如果想得到相对全面,准确的搜索结果,必须同时使用多个搜索引擎,在这样的背景下便产生了元搜索引擎。 元搜索引擎是通过调用其他搜索引擎来实现搜索的一种网络检索工具。元搜索引擎一般没有自己独立的数据库,而是通过对多个独立搜索引擎的整合、调用、控制和优化来实现信息检索。元搜索引擎通过一个统一界面,帮助用户选择和利用合适的搜索引擎来实现检索操作,并将所有检索结果按某种策略集中起来以统一的格式呈现在用户面前。虽然这样在一定程度上方便了用户的查询,但是同传统搜索引擎一样,元搜索引擎对每个用户的检索要求都给出相同的检索结果,并没有考虑用户个性化的需求对检索信息予以重组、过滤。 针对这种情况,本文给出了一个基于Agent的个性化元搜索引擎S4U。该系统突出用户个性化特色,能够针对不同用户从众多搜索结果中选出最符合用户需求的文档。系统通过使用向量空间模型来建立用户兴趣模型,并通过Agent来学习用户的兴趣,动态地修改用户兴趣模型,使其能够反映用户当前的兴趣。本文也对成员搜索引擎进行了形式化描述,提出并实现了一个提取成员搜索引擎的检索结果的通用算法,从而解决了元搜索引擎从各个成员搜索引擎提取搜索结果时需要定制该搜索引擎的提取算法、用户不能动态添加删除成员搜索引擎的问题。 本文最后给出了个性化元搜索引擎的实现方案,并对该系统进行测试和分析,实验数据证明本系统在信息推荐、信息查准率和召回率等方面都取得了较好的效果。