个性化元搜索引擎研究与设计

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:xpzcz1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web技术的发展,Internet已经发展成为一个巨大的全球化信息空间。在这种情况下,用户面对浩瀚的信息海洋,往往无法准确找到自己所需要的信息。传统搜索引擎的出现在一定程度上解决了Web信息检索困难的问题,但是,由于不同的搜索引擎所采用的算法和搜索范围各异,导致返回结果的重复率不到34%。如果想得到相对全面,准确的搜索结果,必须同时使用多个搜索引擎,在这样的背景下便产生了元搜索引擎。 元搜索引擎是通过调用其他搜索引擎来实现搜索的一种网络检索工具。元搜索引擎一般没有自己独立的数据库,而是通过对多个独立搜索引擎的整合、调用、控制和优化来实现信息检索。元搜索引擎通过一个统一界面,帮助用户选择和利用合适的搜索引擎来实现检索操作,并将所有检索结果按某种策略集中起来以统一的格式呈现在用户面前。虽然这样在一定程度上方便了用户的查询,但是同传统搜索引擎一样,元搜索引擎对每个用户的检索要求都给出相同的检索结果,并没有考虑用户个性化的需求对检索信息予以重组、过滤。 针对这种情况,本文给出了一个基于Agent的个性化元搜索引擎S4U。该系统突出用户个性化特色,能够针对不同用户从众多搜索结果中选出最符合用户需求的文档。系统通过使用向量空间模型来建立用户兴趣模型,并通过Agent来学习用户的兴趣,动态地修改用户兴趣模型,使其能够反映用户当前的兴趣。本文也对成员搜索引擎进行了形式化描述,提出并实现了一个提取成员搜索引擎的检索结果的通用算法,从而解决了元搜索引擎从各个成员搜索引擎提取搜索结果时需要定制该搜索引擎的提取算法、用户不能动态添加删除成员搜索引擎的问题。 本文最后给出了个性化元搜索引擎的实现方案,并对该系统进行测试和分析,实验数据证明本系统在信息推荐、信息查准率和召回率等方面都取得了较好的效果。
其他文献
随着网络技术的飞速发展,新型网络应用的不断涌现以及网络带宽不断提高,网络数据呈现出快速增长的趋势,对网络数据处理技术提出了越来越高的要求。基于软件的网络数据处理技
第三代P2P系统大多数都提供了一种DHT算法,它将网络中的资源随机地分布在参与网络的各个节点上。在某种情况下,某些节点分配到的资源是平均水平的O(10gN)倍。而且,在标识符空间
“基于XML远程教育资源描述与管理系统的研究与实现”论文是结合科技部十五重大科技攻关项目:“网络教育关键技术及示范工程”的“非实时教学系统”课题进行的。论文旨在研究
网络可靠性评估是无线传感器网络(Wireless Sensor Networks, WSN)设计和优化的核心步骤,但现有的WSN可靠度求解模型没有考虑WSN在通信时延、不完全覆盖(ImPerfect Coverage,
随着计算机技术与信息技术的快速发展,非线性动力学方法在生物医学信号分析领域的应用越来越广泛。然而,准确的分析、鉴别脑电信号并非易事,通常需要专家们记录连续几天的脑
介质损耗因数是反映电力电容器、电容型套管、电容型电流互感器、电容式电压互感器等电力网络中高电压电气设备绝缘性能的一项重要指标,通过测量介质损耗角可以监测出绝缘介质
随着Internet/Intranet的快速发展,部门之间需要协同合作,如何共享这些异构数据源的数据成为很至关重要的问题。同时异构数据库的存在给实现不同信息系统间数据的访问操作带
现代故障诊断系统是一个动态的、分布的、柔性的和不确定的复杂系统。多Agent能够利用并行分布式处理技术和模块化设计思想,把复杂系统划分成相对独立的Agent子系统,通过Agen
随着软件产业的发展,遗产软件日益增多,软件再工程已经成为一个重要的研究领域。系统理解是软件再工程的基础,可以弄清一个程序“做什么”以及“如何做”,目前存在着许多正在使用
近年来信息技术迅猛发展,很多的信息管理领域得到发展并不断壮大。电子商务、电子政务、办公自动化和企业信息系统的应用成为了当今管理信息系统应用的热点。在这些领域中,业