论文部分内容阅读
当前的时代是一个互联网迅速发展的时代,互联网上充满了各种类型的信息资源,并且这些信息资源的数量正迅速膨胀。正是因为这个世界的不断信息化、数字化的发展,搜索引擎技术就成为了人们获取网络信息资源的重要途径,它的重要性深入人心。而普通的通用搜索引擎已经很难快速、准确的找到用户需要的网页,所以垂直搜索引擎的产生就成为了必然。与通用搜索引擎相比较,垂直搜索引擎可以提供更加专业、精确的和有一定深度的检索服务。但从垂直搜索引擎与通用搜索引擎的相关关键技术上来讲,他们在此方面还是十分相似的,它们主要的区别,还是在于是否在网页信息抽取时进行结构化抽取,形成结构化的信息数据。所以,垂直搜索引擎虽然在一定程度上改善了检索结果的效果,但仍旧没有摆脱依靠关键词检索的方式,满足不了用户进行语义检索的需求。而随着本体技术在各个领域的应用逐渐广泛,同时为了满足某些特定领域、有着特定需求的用户,就出现了基于本体的垂直搜索引擎研究。本文就是对本体与垂直搜索引擎的相关理论知识、设计理念及相关的实现技术等做了介绍及研究,希望通过本体模型与垂直搜索引擎的结合来提高搜索的查全率、查准率,最后主要的工作在于实现领域本体构建并设计实现简单模型。最后通过以上理论的研究,运用本体构建工具Protégé4.0构建了影院领域本体,对基于本体的垂直搜索引擎的模型进行分析设计。在总体设计方面来用的是模块化思想,垂直搜索引擎被分为信息抓取系统、信息预处理子系统、索引子系统和检索子系统,各子系统相对独立。