论文部分内容阅读
[摘要]SAO三元结构具有易于理解和表达的语义关系,将其作为挖掘分析的基本单元,深度分析专利文本蕴含的技术语义有助于揭示技术功效关系。从SAO结构的定义及特征出发,提出了基于SAO结构的专利技术功效图构建的思路、流程及方法,采用基于SAO结构的共现关系构建技术功效矩阵,探讨了基于SAO结构的技术主题、功效主题分析方法。通过石墨烯传感器领域为例的实证研究验证了方法的有效性。
[关键词]专利;技术功效图;SAO结构;主题聚类
DOI:10.3969/j.issn.1008—0821.2017.06.008
[中图分类号]G255.53 (文献标识码]A [文章编号]1008—0821(2017)06—0048—07
作为外界公开的技术知识产权信息载体,专利是目前最常用和有效的有价值技术内容获取来源途径。如何有效分析和理解海量专利大数据中的技术本质是科技研发人员及有关管理决策者面临的重要问题。在各种技术分析和管理工具中,技术功效图具有表现直观、语义清晰的优点,是应用广泛的专利分析手段。技术功效图的完成并不是一件简单和容易的工作任务,工作量大、依赖专家、技术的复杂性等都制约了其绘制的效率和效果。
准确而高效地界定、识别专利的技术和功效维度特征是构建技术功效图的關键环节,自然语言处理、专利语义识别、数据挖掘、数据可视化等技术与工具已经成为支撑技术功效图自动或半自动化构建的基础。比如,王丽等提出了基于文本挖掘技术的主题词自动标引方案,以此为基础说明了具有自动化特征的技术功效图构建系统Patent-TEM。陈颖等从专利文本的结构分析出发,借鉴TRIZ理论中的物一场模型,提出了识别专利文本中技术与功效部件的方案,归纳了技术词与功效词的识别规则。翟东升等将数据仓库、大数据分析框架应用于技术功效图构建,从数据组织及计算框架的角度分析了技术功效图中的关键技术。陈颖等提出了面向技术功效矩阵构建的词汇模型,能较好满足专利技术功效矩阵分析的多技术主题、分析任务临时性强、主题范围可选等特点。尽管基于文本挖掘分析的技术功效分析框架获得了一定程度进展,但如何准确界定、理解技术词汇依然较为困难,需要能够解析文本词语背后所表达的潜在技术特征及内涵。进一步,深度的技术语义分析和理解是提升和优化技术功效分析系统的重要基础。
近年,学者开始关注专利文本中的SAO(Subject-Ac-tion-Object)结构特征,为识别出隐含的技术语义提供了一种研究途径。通常的主题词标注方法将技术与功效属性分别抽取与识别,可能忽略了内在的关联性。SAO不但显式地包含了技术主题,而且保持了技术属性间的内在关联,蕴含了有价值的技术性启发信息。基于SAO结构的技术语义分析已被迅速应用到多个应用领域,例如R
[关键词]专利;技术功效图;SAO结构;主题聚类
DOI:10.3969/j.issn.1008—0821.2017.06.008
[中图分类号]G255.53 (文献标识码]A [文章编号]1008—0821(2017)06—0048—07
作为外界公开的技术知识产权信息载体,专利是目前最常用和有效的有价值技术内容获取来源途径。如何有效分析和理解海量专利大数据中的技术本质是科技研发人员及有关管理决策者面临的重要问题。在各种技术分析和管理工具中,技术功效图具有表现直观、语义清晰的优点,是应用广泛的专利分析手段。技术功效图的完成并不是一件简单和容易的工作任务,工作量大、依赖专家、技术的复杂性等都制约了其绘制的效率和效果。
准确而高效地界定、识别专利的技术和功效维度特征是构建技术功效图的關键环节,自然语言处理、专利语义识别、数据挖掘、数据可视化等技术与工具已经成为支撑技术功效图自动或半自动化构建的基础。比如,王丽等提出了基于文本挖掘技术的主题词自动标引方案,以此为基础说明了具有自动化特征的技术功效图构建系统Patent-TEM。陈颖等从专利文本的结构分析出发,借鉴TRIZ理论中的物一场模型,提出了识别专利文本中技术与功效部件的方案,归纳了技术词与功效词的识别规则。翟东升等将数据仓库、大数据分析框架应用于技术功效图构建,从数据组织及计算框架的角度分析了技术功效图中的关键技术。陈颖等提出了面向技术功效矩阵构建的词汇模型,能较好满足专利技术功效矩阵分析的多技术主题、分析任务临时性强、主题范围可选等特点。尽管基于文本挖掘分析的技术功效分析框架获得了一定程度进展,但如何准确界定、理解技术词汇依然较为困难,需要能够解析文本词语背后所表达的潜在技术特征及内涵。进一步,深度的技术语义分析和理解是提升和优化技术功效分析系统的重要基础。
近年,学者开始关注专利文本中的SAO(Subject-Ac-tion-Object)结构特征,为识别出隐含的技术语义提供了一种研究途径。通常的主题词标注方法将技术与功效属性分别抽取与识别,可能忽略了内在的关联性。SAO不但显式地包含了技术主题,而且保持了技术属性间的内在关联,蕴含了有价值的技术性启发信息。基于SAO结构的技术语义分析已被迅速应用到多个应用领域,例如R