基于元搜索的企业网站检索系统CogentSearch的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:guoyurun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息化高速发展的今天,企业对于网站功能的需求正在不断加强。随着企业网站的规模急速膨胀,企业网站站内搜索的需求油然而生。在过去的实践经验中,基于数据库检索的站内搜索和基于本地索引的站内搜索均体现出了明显的不足之处,作为替代产品的基于搜索引擎抓取的站内搜索结构虽然较好的解决了前两者的不足,但其因为搜索引擎本身的局限性,基于搜索引擎抓取的站内搜索结构拥有覆盖面不广、全面性不高的缺点。 本文在深入分析国内外相关领域的研究工作的基础上,设计与实现了基于元搜索的企业网站检索系统CogentSearch,CogentSearch采用了元搜索的思路来优化站内搜索问题的解决方案,找到了元搜索与站内搜索的结合点,并在元搜索的过程中基于站内搜索的特点,提出了一种特别的合并排序技术,优化了站内搜索结果的排序,使元搜索更好的为企业网站站内搜索服务。 具体来讲,本文主要有以下贡献: ■分析了企业网站站内搜索引擎的重要性,并研究了过去站内搜索引擎常用的三种方式,提出了他们的不足之处。 ■调研了元搜索引擎的特点和应用,并寻找到了站内搜索与元搜索引擎的结合点。 ■为了更好的解决企业站内搜索的问题,本文提出了基于元搜索的企业网站检索系统的设计思路,并阐述了系统CogentSearch的设计与实现。 ■在元搜索引擎中,排序是其核心问题。本文详细阐述了系统CogentSearch中关于rank point的计算,以PageRank等技术作为基础思路强化了站内搜索结果中站内链接的作用,以达到更优化的搜索结果。
其他文献
随着计算机技术的广泛应用,现代科学技术的不断进步和生产制造业的迅速发展,出现了许多庞大而复杂的科研工程项目,它们工序复杂,协作面广,常常需要动用大量的人力、物力和财力。因
包装纸盒的三维仿真是指根据包装纸盒的平面展开图数据,用软件模拟出纸盒的折叠过程和最终的三维成型效果,以供设计者检查盒型是否满足设计要求。这样可以及早地发现设计失误,同
空间数据挖掘的主要特征是分析空间关系,然而,某特定空间的属性总是联系的,且能由其邻接对象的属性来解释。相对于关系数据库里的挖掘,空间数据挖掘算法为了提取有用的知识,需要考
据中国互联网络信息中心统计,截止2014年6月底,手机网民规模首次超越传统PC网民规模。Android开源操作系统凭借其充分的开放性,取得了飞速发展,市场占有率遥遥领先于iOS等其他移
边缘是图像最基本的特征,因而边缘检测是图像处理中的重要内容。近十几年来,迅速发展起来的小波理论为图像处理带来了新的理论和方法,由于小波变换的良好局部特性与多尺度特
在工业、社会、经济和管理等众多领域中,人们面临着大量的最优化问题。用模拟生物界自然现象而发展起来的群智能优化算法来解决此类问题已被越来越多研究者所关注。PSO(Parti
本文在模糊推理插值器和真值递延法的研究基础上,探讨了“等价式形式系统”(用等价式代替传统蕴涵算子所得到的新的形式逻辑系统)的二值命题演算理论。按照传统命题逻辑形式系
随着经济的发展,新的收费道路的建设,公路网覆盖地区及经济辐射区域的扩大,给路网收费设计提出了新的要求。一个是收费位置的确定,如果不考虑各地实际的经济水平和交通流量的大小
形态分析作为一种重要的股票投资方法,已经得到了广泛的应用。技术形态是股价序列中反复出现的模式,这些模式中隐含着对预测将来股价有用的信息。 过去的股价形态如果用股票
目前,基于Web方式的B/S架构模式瘦客户端应用程序正被人们广泛关注,基于这一模式的应用程序系统也被得到大量的开发。B/S架构模式的应用程序以它集中部署、集中管理和集中维护