元搜索中成员搜索引擎的选择问题研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:abc123student
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前搜索引擎作为用户查询信息的主要工具,在网络中扮演的角色越来越重要。但是普通的搜索引擎覆盖的范围比较有限。如何能够更加全面和准确地满足用户的检索需求是一个亟待解决的问题。元搜索能够将用户的查询分发给多个搜索引擎进行处理,同时将反馈回的结果进行整理。相比于单独的搜索引擎,元搜索在信息获取的广度上能够更好地服务用户。但是市场上存在的搜索引擎众多,如果不加区分地将每个查询都分发给所用的成员引擎,不仅会增大连接开销而且在海量结果的整合上也会造成处理资源的浪费。如何保证只将查询发送给相关的搜索引擎一直是一个挑战性的问题。  本文研究元搜索中成员搜索引擎的选择问题,主要通过利用以往查询等有用信息对用户查询和搜索引擎的相关性进行评估,并根据相关性的大小推荐一组搜索引擎以供用户查询。  主要内容如下:  (1)提出一种加权的选择机制,确定以往查询和引擎的相关性。每一个查询都有一组返回结果。多个结果之中可能含有相同值。加权的选择能够避免相同的结果重复用于计算相关性之中。  (2)提出基于遗传算法的选择机制。引擎的选择最终是依据查询和各个引擎之间的适应值。遗传算法的突变、选择能够显著增加各个引擎之间的适应值。  (3)提出神经网络在引擎选择中的运用。用户查询和成员引擎相关性计算的一个重要依据就是以往查询和用户查询的相似性计算。神经网络的径向基函数提供的分类方法可以较好地用来计算用户查询和以往查询之间的相似性。
其他文献
万维网(WWW)目前是一个巨大的、分布广泛的全球信息服务中心,它涉及到新闻、财经、广告、商务、文化、教育等信息服务。然而面对复杂而庞大的万维网,多数用户感到力不从心。
该文中采用了Roger Weber提出的VA-file的索引结构,其在高维环境下的检索效率比R树系列和X树等索引结构都高出了许多,特别是针对复杂的最邻近检索和相似性检索.最邻近检索和
软件测试是当今计算机科学与工程中起着至关重要作用的领域之一。近年来,随着软件测试理论和技术的不断发展,它已成为软件工程领域内保证软件质量的必不可少的关键过程。 状
工作流管理一直是企业界和学术界关注的领域。但是目前许多工作流模型在正确性和可靠性方面都有很大不足,并不能适应实际应用的需要。本文将事务性质引入工作流中,提出了一种嵌
授权机制是访问控制的核心,即控制不同用户对信息资源的访问权限.RBDM是单域环境下一个基于角色的进行授权控制的授权模型,对RBDM进行改进使得型更好地支持部分授权等特征,提
对多媒体信息的知识产权保护,已经成为学术界与产业界共同关注的问题。数字水印技术作为保护多媒体信息的版权的一种新方法正受到人们的极大重视。作为一种新兴的媒体数据,三维
分类器学习方法是人工智能研究的核心问题之一。好的分类器学习算法,能使应用系统更加智能化。最近几年,神经信息学得到了飞速的发展。人类或者生物体的智能是机器智能的源头,人
该论文针对分布式系统软件测试的特点,设计开发了一个分布式系统软件接口测试平台.论文的工作主要包括以下几点:对软件测试技术的发展过程做了一个较全面的研究,对分布式系统
集装箱自动识别系统在海关物流监控系统、港务局集装箱管理系统、场站集装箱管理系统、加工区监管系统、运输行业集装箱管理系统等领域有着广泛的应用。基于光学字符识别技术
随着自动控制技术,计算机技术及信息网络技术的飞速发展,促使控制网络技术应运而生。控制网络Infranet(infrastruacture network)是一类特殊的局域网,现代计算机控制系统的广泛应用,极大地促进了控制网络技术不断发展和完善,它不仅使生产过程向更高层次的自动化水平发展,实现了优化控制、协调控制及远程监控等,也为其与信息网络的无缝集成,组建统一的企业网络提供了强有力的技术支持。本文