论文部分内容阅读
在信息化高速发展的今天,企业对于网站功能的需求正在不断加强。随着企业网站的规模急速膨胀,企业网站站内搜索的需求油然而生。在过去的实践经验中,基于数据库检索的站内搜索和基于本地索引的站内搜索均体现出了明显的不足之处,作为替代产品的基于搜索引擎抓取的站内搜索结构虽然较好的解决了前两者的不足,但其因为搜索引擎本身的局限性,基于搜索引擎抓取的站内搜索结构拥有覆盖面不广、全面性不高的缺点。
本文在深入分析国内外相关领域的研究工作的基础上,设计与实现了基于元搜索的企业网站检索系统CogentSearch,CogentSearch采用了元搜索的思路来优化站内搜索问题的解决方案,找到了元搜索与站内搜索的结合点,并在元搜索的过程中基于站内搜索的特点,提出了一种特别的合并排序技术,优化了站内搜索结果的排序,使元搜索更好的为企业网站站内搜索服务。
具体来讲,本文主要有以下贡献:
■分析了企业网站站内搜索引擎的重要性,并研究了过去站内搜索引擎常用的三种方式,提出了他们的不足之处。
■调研了元搜索引擎的特点和应用,并寻找到了站内搜索与元搜索引擎的结合点。
■为了更好的解决企业站内搜索的问题,本文提出了基于元搜索的企业网站检索系统的设计思路,并阐述了系统CogentSearch的设计与实现。
■在元搜索引擎中,排序是其核心问题。本文详细阐述了系统CogentSearch中关于rank point的计算,以PageRank等技术作为基础思路强化了站内搜索结果中站内链接的作用,以达到更优化的搜索结果。