论文部分内容阅读
大数据时代的到来让关键词自动标引显得尤为重要。关键词是由一个或多个字组成的短语,它可以展示一篇文档中的重要概念。专利文献的关键词拥有非常重要的作用,如专利检索、专利分析、专利摘要、自动索引,专利聚类或分类等等。目前大多数专利没有标注关键词,手工标引速度慢、效率低、标引一致性差,因而借助于计算机对专利文献进行自动标引,可以全面、准确、高效的自动提取专利文献信息。而系统可视化不仅可以让它看上去更加美观,最重要的是可以提高标引效率,使得标引结果清晰直观地表现出来。本论文采用观察法和访谈法对专利关键词自动标引可视化现状进行了调查,然后针对不同用户的需求和现状不足进行优化设计。观察对象是现有的自动标引系统,主要观察它们的界面和可视化图形,深入分析现有的优势和不足;访谈对象是专利关键词自动标引的工作人员、专利申请人、专利分析人员、专利相关系统的技术人员和其他学术研究人员,通过与他们的访谈,探寻用户需求。笔者与15位专利工作领域的专家进行了访谈,针对专利关键词自动提取可视化方面,他们给出了自己的需求和建议,在此基础之上结合观察的数十个自动标引系统现状,从概念层和功能层上做出了系统优化方案。