论文部分内容阅读
目前搜索引擎作为用户查询信息的主要工具,在网络中扮演的角色越来越重要。但是普通的搜索引擎覆盖的范围比较有限。如何能够更加全面和准确地满足用户的检索需求是一个亟待解决的问题。元搜索能够将用户的查询分发给多个搜索引擎进行处理,同时将反馈回的结果进行整理。相比于单独的搜索引擎,元搜索在信息获取的广度上能够更好地服务用户。但是市场上存在的搜索引擎众多,如果不加区分地将每个查询都分发给所用的成员引擎,不仅会增大连接开销而且在海量结果的整合上也会造成处理资源的浪费。如何保证只将查询发送给相关的搜索引擎一直是一个挑战性的问题。 本文研究元搜索中成员搜索引擎的选择问题,主要通过利用以往查询等有用信息对用户查询和搜索引擎的相关性进行评估,并根据相关性的大小推荐一组搜索引擎以供用户查询。 主要内容如下: (1)提出一种加权的选择机制,确定以往查询和引擎的相关性。每一个查询都有一组返回结果。多个结果之中可能含有相同值。加权的选择能够避免相同的结果重复用于计算相关性之中。 (2)提出基于遗传算法的选择机制。引擎的选择最终是依据查询和各个引擎之间的适应值。遗传算法的突变、选择能够显著增加各个引擎之间的适应值。 (3)提出神经网络在引擎选择中的运用。用户查询和成员引擎相关性计算的一个重要依据就是以往查询和用户查询的相似性计算。神经网络的径向基函数提供的分类方法可以较好地用来计算用户查询和以往查询之间的相似性。