论文部分内容阅读
创新是推动技术发展和加快经济增长的关键动力,实施创新驱动战略已成为国家战略,为经济建设提供了新动能。专利是最典型的知识产权,蕴含着大量创新知识,对专利文本的知识挖掘和有效利用可促进创新发展,辅助企业和个人进行创新设计,为大众创业、万众创新提供技术支撑。但专利以非结构化的文本形式存在,计算机难以理解其中包含的创新知识,尤其是其中蕴含的创新目的、创新机制和运用的创新发明原理等隐含知识。如何从海量的专利文本数据中挖掘有价值的创新知识,并将专利数据间复杂的关联信息清晰明确地展示出来,面临巨大挑战。大数据和人工智能技术为专利创新知识抽取和利用提供了契机。基于国家科技部创新方法专项支持,提出利用知识图谱和信息抽取技术等知识工程方法对专利文本中蕴含的隐性创新知识进行挖掘和分析以辅助和引导用户的创新设计活动。文章设计和研发了一个基于专利知识工程的创新服务引擎,为进行技术升级改造的企业、从事科学研究的科研人员和具有创新知识需求的普通大众用户等提供专利创新知识抽取、专利引证关系分析、技术趋势分析与预测、跨技术领域的多样化专利推荐等服务,充分解决了不同用户的创新信息需求。系统主要功能包括专利的结构化信息抽取与解析、基于专利知识图谱的数据动态管理、专利的便捷检索、专利信息的可视化展示与分析和基于创新模式的专利推荐等。专利的结构化信息抽取与解析模块主要包括专利数据的获取、专利数据的预处理、神经网络模型构建、结构化信息抽取结果的解析等,将专利文本中蕴含的创新目的、创新机制和创新发明原理等隐性知识展示给用户;基于专利知识图谱的数据动态管理模块通过构建专利知识图谱来存储海量专利数据以及专利数据之间的各类语义关系,可支持海量专利文档图谱语义化处理;专利信息的可视化展示与分析模块包括发明人地图、发明机构地图、代理机构图谱、专利引证图谱、技术趋势演变图等功能,形象直观地分析专利数据间的关联关系;专利的便捷检索模块提供基于不同字段的检索方式,包括基于关键词检索、基于主题检索、基于发明人检索、基于 IPC(International Patent Classification)分类号检索等,便于用户快速找到相关专利;基于创新模式的专利推荐模块包括创新模式的集成和专利推荐模块,基于学到的“目的-机制-发明原理”结构化表示,允许用户自定义创新模式,满足用户不同的创新需求。系统研发过程中,基于实体抽取和深度学习等前沿技术,提出了基于神经网络模型的专利目的、机制和发明原理等结构化信息抽取与表示技术,提高专利创新知识抽取结果的准确率的同时为基于创新模式的专利推荐等服务提供技术支撑;利用图数据库Neo4j存储专利知识图谱,提供一套数据操作引擎进行专利数据的增删改查,根据图谱上实体语义关系支撑专利信息推理和创新专利推荐服务;利用Echarts可视化框架实现专利数据的多维关联分析。文章从创新服务引擎的需求定位、概要分析、详细设计和实现、系统测试等方面做了全面叙述。创新服务引擎实现了 300万余条专利数据的采集和管理,利用神经网络模型抽取并分析了专利文本中蕴含的创新目的、创新机制和创新发明原理等隐性创新知识,模型抽取结果的准确率达93.5%,可满足用户对专利创新知识的信息需求。创新服务引擎在创新方法培训机构、技术转移中心等进行示范应用,为2000余名用户提供专利价值分析、技术趋势分析等服务,辅助用户总结创意解决方案5000余份,帮助50多家企业进行技术升级改造,激发用户创新能力的同时提高了创新活动的效率。