论文部分内容阅读
搜索引擎的出现并迅速普及给互联网带来革命性的突破,人们通过搜索引擎可以轻松地找到自己所需的信息。但随着信息多样化、复杂程度的增加,使人们对网络信息检索提出了更高的要求。尤其在科技资源领域,因为大部分描述科技资源的关键字具有很强的专业性和复杂性,一般用户很难准确地掌握它并将其提交给搜索引擎进行搜索,因此在用传统搜索引擎搜索科技资源时,对用户的搜索操作要求很高。本文研究构建的搜索引擎则试图改善对科技资源的搜索操作,弥补传统搜索引擎对科技资源领域搜索时的不足,通过对问题的语义理解,找出针对用户需求的相关科技资源,最终给用户提供更全面、更精准的科技资源反馈。本文先对目前的搜索引擎的现状进行概括,总结传统搜索引擎的不足。提出应用语义理解实现搜索引擎对需求的处理,针对科技资源领域构建一个基于本体的搜索引擎框架,并对相关的核心技术进行深入研究。本文的主要研究成果:(1)设计了一个基于本体的科技资源搜索引擎的框架。通过这个搜索引擎,用户可以模糊输入查询需求,系统会对问题进行语义分析、识别,最后将该问题的相关科技资源信息反馈给用户。(2)建立了一个科技资源领域的小型本体。本体库不仅是词汇表,更是一个表示信息数据之间联系的关系网。利用本体描述事物概念和事物之间联系的特性,构建搜索引擎的核心知识库。(3)对构建搜索引擎的主要方法和核心技术进行了研究和探讨。其中包括本体技术、语义理解、信息索引等知识。(4)对目前的搜索引擎的平台和功能延伸拓展,丰富了搜索引擎的应用模式,优化了系统的应用局限性,多角度地满足用户的需求。本文所设计构建的科技资源搜索引擎并不是对用户提交的关键词直接搜索,而是搜索相关的科技资源。用户只需提供模糊关键字并选择搜索范围,搜索引擎就可通过对用户需求的语义处理和相关资源的确定,理解用户对科技资源的搜索要求,从而提高在科技资源领域搜索的查全率和查准率。本文内容系上海市科委研发服务平台重大专项课题“资源共享平台技术规范制定与实施”(课题编号:06DZ22038)的研究成果。