基于移动Agent的搜索系统的研究

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:helen515
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,搜索引擎已经成为互联网的主要应用。随着Internet的信息量迅速增长,传统搜索引擎不能很好地适应这个变化。而一般分布式搜索系统由于系统的异构性及要求子系统配合协作,因而扩展性不强,未能体现真正分布系统的优越性。移动Agent作为新一代分布式处理技术,它的移动性、自治性、主动性、协作性、智能性等特性为分布式搜索引擎带来了新的生命力,可以最大限度地节省服务器资源和网络带宽,很好地解决了目前分布式搜索系统存在的许多问题,是搜索系统的一个新的发展趋势。 本文首先介绍了集中式和分布式两类搜索引擎,分析了国内外分布式搜索引擎的研究现状及发展趋势,指出了目前分布式搜索引擎存在的不足。针对这些不足,本文讨论了移动Agent和搜索引擎相关技术及其性能优势,并讨论了一个基于Agent的搜索引擎系统体系结构,介绍了系统的工作原理及各模块的功能。该系统采用元搜索引擎的结构,以Agent作为架构系统的基本组件,利用Agent的自治性和协作性,使搜索系统的性能得到了很大的提高,不仅网络流量小,且减少了查询时间,同时也简化了系统处理的复杂度。指出了移动Agent应用于搜索系统是解决网络环境下大量信息资源检索的有效途径。但是,由于移动Agent携带了代码、状态信息、结果数据等各种信息,随着搜索站点的增加会产生大量的数据传输,增加网络负担,因此移动Agent技术不利于构建大型的分布式搜索系统。针对这个问题,本文设计了基于移动Agent的搜索引擎模型,并对该模型的系统结构及工作流程进行了详细的分析。最后利用移动Agent的开发工具ASDK初步实现了该模型的部分功能,验证了本系统的可行性。本文的主要研究工作和创新如下: 1. 分析了国内外分布式搜索引擎的研究现状,指出了目前分布式搜索引擎的不足,针对这些不足,讨论一种基于移动Agent的搜索系统; 2. 由于不同搜索系统对查询语句的理解差异性,降低了查准率,本文讨论了对用户提交的查询语句进行XML规范化的处理,有助于异构系统对查询语句的理解; 3. 考虑到移动Agent之间通信交互携带了大量的信息,提出在系统中增加路由Agent的设想,通过搜索引擎的注册信息特征:如搜索区域,搜索类别等,对搜索路线进行配置,不仅有助于加快响应速度,同时也有助提高搜索覆盖率; 4. 考虑到不同的元搜索引擎返回的结果信息存在大量冗余,提出在保存结果信息前,与上一搜索站的结果信息进行比较、去冗余、排序等结果处理,并重新调整权重值; 分析了基于移动Agent的搜索系统的模型和工作流程,利用ASDK和Java开发工具初步实现了该模型。
其他文献
移动互联网是下一代网络发展的趋势之一,移动IPv6 是移动互联网的基石。 目前,移动设备越来越多,这些设备也迫切地希望能在任何地点、以任意的接入方式(有线或无线)、用固定
图像检索涉及到的研究范围比较广。本文仅对图像检索中所涉及到的图像分割、图像的自动语义标注以及标注图像的语义分类等几个关键性问题,进行了深入和系统的研究,提出了一些新
分布式查询优化的研究领域是分布式数据库中的研究热点。由于集中式数据库和分布式数据库的区别在于,分布式数据库需要站点间的数据传输。所以大多数研究分布式查询优化以减少
单元测试是为了发现软件设计的最小单位(程序模块)中存在的错误而进行的测试工作。作为软件项目中最早介入的测试工作,单元测试是集成测试和系统测试的基础,单元测试的成功与否
认知无线电(Cognitive Radio,CR)由于其动态分配频谱资源特性,能帮助认知用户在不影响授权用户的条件下伺机地使用某段空闲频谱,实现授权用户与认知用户之间频谱资源的共享,解决了
AdHoc网络是由一组带有无线收发装置的移动终端组成的一个多跳的临时性自治系统,是一种无中心的分布式控制网络。网络中各节点既是主机又充当路由器,可以通过无线链接构成任意
女书是中华民族文化宝库的瑰宝,是世界极其重要的非物质文化遗产。由于各种原因,近年来女书处境艰难,亟待信息化保护。采用现代科学技术来数字化女书对女书的传承和发展具有重大
近年来,分布式在线社会网络DOSNs(Distributed Online Social Networks)作为一种新型的在线社会网络结构备受关注。它在一定程度上克服了集权式管理的缺点,但在分布式在线社会网
瓦斯检测仪是一种主要用于检测煤矿作业区瓦斯浓度的检测仪器。红外光谱吸收式瓦斯检测仪是利用某种气体只对固定波长的红外光有较强吸收性的原理而研制成的一种瓦斯检测仪。
随着网络和信息技术的发展,各种网络应用不断普及。网络在给人们带来巨大便利的同时,也不可避免地遭受来自内、外网络的各种安全威胁。“如何应对网络中新出现的、未知的‘瞬时