论文部分内容阅读
传统的搜索引擎以关键字全文检索作为检索模式,具有简单、快速、分布式等优点,目前已经成为互联网中最重要的信息检索工具。但传统搜索引擎无法理解用户真正的查询意图,无法理解Web中数据的语义信息,无法通过概念之间的关联进行查询。这会导致搜索结果的查全率和查准率比较差,且无法实现知识检索。语义网技术是解决以上搜索引擎问题的最有前景的方法。本体是构建是语义网的一种有效方法,具备概念化、明确、形式化、共享等特点。基于本体技术可以构造能够实现语义查询、语义推理的知识库系统。元搜索引擎可以利用各成员搜索引擎的检索优势,并对搜索结果进行融合,在现有的搜索引擎格局内达到最优的检索效果。由于元搜索引擎不需要创建索引数据库,因此论文将其用来作为实现本体知识库检索的平台。为了对本体检索进行深入研究,论文提出了一个基于本体的智能搜索引擎系统框架,旨在改变现有的检索模式,实现由全文检索模式向知识检索模式转变。以提高搜索引擎的查全率和查准率。本体知识库可以帮助元搜索引擎扩展语义检索功能,从而可以实现同时对语义Web和Web的检索,并在这两个层面的检索结果之间建立参照关系,以辅助用户对语义检索结果准确性的判定。文中,对本系统涉及的各个方面进行了详细的论述,包括OWL知识库的构建、基于Jena的本体的操作方法、基于SWRL的本体推理,并且分析了各个子系统在框架中的作用和工作模式。该系统采用智能检索代理程序对本体知识库进行检索,从而减轻了用户检索的工作量,增强了搜索引擎处理复杂查询的能力。同时,针对互联网异构本体的查询,提出了一个基于Web Service的分布式多本体发现和调用模型。Web Service是一种很成熟的互联网基础架构,具有标准的协议和广泛的支持。同时,还可以通过对UDDI中的tModel扩展,使Web Service可以通过OWL-S进行语义描述。最后,论文介绍了一个实际的检索案例,并且比较和分析了其在现有搜索引擎和在基于本体的元搜索引擎下的查询步骤和查询效果。通过以上实验发现,采用基于本体的元搜索引擎能得到更令人满意查准率和查全率,而且用户的查询步骤和查询时间也大大减少。虽然以上查询是在理想的实验环境中完成,但是本体技术与搜索引擎的结合的确能够推动搜索引擎的发展。