论文部分内容阅读
技术创新是企业间竞争的重要砝码,对企业发展的支撑作用日益明显。了解所在领域的技术竞争态势和专利布局,并在此基础上,确定自己的技术创新思路,研发核心技术,进行有效的专利组合布局,是企业面临的重要课题。专利是企业技术竞争情报获取的重要来源,通过对专利信息的分析挖掘,可以了解领域技术发展趋势、市场竞争态势,以支撑正确的决策等。专利分析有定量分析、定性分析和拟定量分析,专利地图是专利分析的可视化展示工具。专利技术功效图是专利地图的一种,采用定量与定性相结合,是一种拟定量分析方法。它以横轴表示技术类别、纵轴表示功效类别(纵横轴可交换)、交叉点表示相应专利数量,通过矩阵方式展示领域专利的内容和布局,可用于对专利进行技术层面深度分析。目前技术功效图的研制还是以人工为主,包括技术和功效词的标引、技术功效列分类、制图等,此方式的人力成本高,制作周期长。已有自动或半自动化构建的探索,但多是局部过程的优化,分析粒度较粗,鲜有系统化的研究,缺乏令人满意的研究成果和产品。因此需要对技术功效图自动构建全过程进行研究,实现最大程度的自动构建,从而提高构建效率,降低人工成本。本文的研究内容和思路是通过调研技术功效图构建、知识抽取和知识图谱构建等技术的国内外研究进展和相关的理论技术基础,分析现有技术功效图构建方法的不足,提出自动构建的需求;根据技术功效图的要素分析和所需知识点在专利文献中的分布特征及句法特征,提出技术主题、应用领域、功效等知识的抽取策略;设计面向技术功效图自动构建的专利知识图谱语义模型,结合抽取的知识和汉语科技词系统中的知识进行专利知识图谱构建;设计基于知识图谱进行技术功效图自动构建模型和流程,并开发原型,进行实证分析:最后,基于自动构建效率高的特征,拓展了跨领域技术借鉴和相似专利检测两种应用模式。本文主要创新点如下:(1)设计了面向技术功效图自动构建的知识抽取策略。在系统研究技术功效图构成要素、构成原理、构建模式、专利知识点分布特征和句法特征的基础上,设计了各类知识相应的抽取策略。综合运用文本规则和依存句法分析的方法实现了知识点的精准抽取,改进了通过机器聚类或基于分类法形成的技术功效图技术分类粒度较粗的问题。根据专利中功效描述只讲优点不谈缺点的特点,采取最简关键词匹配策略,实现了功效抽取的更大覆盖。该部分工作一方面丰富了技术功效图构建的理论基础,另一方面利用抽取的知识对专利进行标注,极大改善了靠人工标注效率低下的现状。(2)设计了面向技术功效图自动构建的专利知识图谱语义模型。该模型使专利中隐含的知识点实现了关联化、立体化展现。其中包括技术词、功效词、领域词等概念词及其词间关系以及与专利权人、发明人等各类实体之间的关联关系。把抽取的知识和汉语科技词系统知识进行融合,构建专利知识图谱,基于该知识图谱扩展了技术功效图矩阵结构生成的模式类型,有效支撑了技术功效图的自动构建。(3)提出了技术功效图自动构建一体化解决方案。该方案包括自动构建模型和数据流程设计,覆盖技术功效图制作全周期,能针对某领域主题,按照一定机制、流程和技术层次控制实现专利技术功效图的自动构建;同时,设计了工程应用时自进化机制,使得技术功效列分类不断优化。该方案提高了构建的速度和灵活性,功能更加丰富,提升了专利情报分析效率,降低了人力成本。(4)拓展了技术功效图两种新的应用模式。传统的技术功效图受制于人工标注的低效率,制作周期长,因此应用模式比较有限。本文实现了技术功效图自动构建,可实时生成图形并满足人机交互需求,随时修改参数,查看改后效果。因此,基于快速构建的优势可实现技术功效图的应用模式扩展,本文提出了其在跨领域技术借鉴和相似专利监测中的应用模式。