论文部分内容阅读
在开放互联的泛在网络时代,尤其是大数据环境下,科技文献资源急剧增长,用户淹没在科技文献的知识海洋中。用户从传统的文献检索系统获得大量的篇章粒度的科技文献后,仍需对获得的文献进行阅读及知识搜寻,人工抽取出其真正所需的文献知识点。这样的知识获取流程不仅极大地耗费用户的科研时间与精力,降低科研产出的成效,而且对用户的专业知识水平提出了更高的要求,形成了一道坚固的知识获取壁垒。其本质原因是现今科技文献知识描述与表示方法的局限:当前知识表示的主要内容为大量的文献外部特征(如作者、出版社等)和较少的文献内容特征(如题目、摘要等);知识描述和表示的最终对象为粗粒度的文献级而非文献内细粒度的知识点。为了解决上述知识获取困境,满足用户日益增长的对快速、精准、智能化知识获取方式的渴求,本文从信息检索的知识描述与表示环节,研究科技文献知识表示的知识元本体方法。本文首先系统地分析了国内外科技文献的文本结构,获取相对统一的科技文献知识结构。其次,以知识元本体理论为基础,给出一种科技文献知识表示的知识元本体方法,将科技文献中句义相对完整的知识点表示为具有统一结构的知识元。另外,运用一系列评价指标和FaCT++推理工具,对本文提出的科技文献知识表示方法进行结构性和功能性评价。最后,采用PHP编程语言和MYSQL数据库软件,以科技文献知识表示方法为基础,设计一个科技文献知识元搜索系统,并将科技文献细粒度知识检索的结果与已有的传统文献检索结果进行对比分析,展现本文给出的科技文献知识检索平台的优势,进一步揭示了科技文献知识表示方法的有效性。科技文献知识表示的知识元本体方法是对科技文献内容中知识点进行细粒度的描述、表示及组织。该方法为挖掘出科技文献内潜在的知识元,提升文献知识检索的效率,推动不同领域的用户进行知识的获取、共享与交流提供一定的理论与方法基础。本文设计的科技文献知识元检索平台,将为未来科技文献领域中细粒度知识检索系统的实现提供一定的实践基础。