【摘 要】
:
[目的/意义]面向当前国内专利审查和专利情报分析工作中对于海量专利分类的客观需求,设计了7种基于深度学习的专利自动分类方法,对比各种方法的分类效果,从而助力专利分类效
【机 构】
:
中国科学院文献情报中心 北京 100190中国科学院大学经济与管理学院图书情报与档案管理系 北京 100190;中国科学院计算技术研究所 北京 100190;
论文部分内容阅读
[目的/意义]面向当前国内专利审查和专利情报分析工作中对于海量专利分类的客观需求,设计了7种基于深度学习的专利自动分类方法,对比各种方法的分类效果,从而助力专利分类效率和效果的提升.[方法/过程]针对传统机器学习方法存在的缺陷,基于Word2Vec、CNN、RNN、Attention机制等深度学习技术,考虑专利文本语序特征、上下文特征以及分类关键特征,设计Word2Vec+TextCNN、Word2Vec+GRU、Word2Vec+BiGRU、Word2Vec+BiGRU+TextCNN等7种深度学习模型,以中国专利为例,选取IPC主分类号的“部”作为分类依据,对比这7种模型与3种传统分类模型在中文专利分类任务中的效果.[结果/结论]实证研究效果显示,采用考虑语序特征、上下文特征及强化关键特征的深度学习方法进行中文专利分类具有更优的分类效果.
其他文献
[目的/意义]针对当前各图书馆、文化馆等公共文化服务机构的多源异构数据,设计出一套行之有效的集成架构.[方法/过程]在充分分析公共文化大数据资源的基础上,对公共文化服务
森林火灾是最为常见的灾害之一,严重危及人类生命安全。及时准确监测森林火灾的发生及火场状况,对应对火灾及减少损失至关重要。当前,森林火灾卫星遥感监测主要以低空间分辨率的卫星遥感为主,空间分辨率过低导致无法探测规模较小火灾及掌握详细火场态势。针对这一问题,结合近些年中高空间分辨率卫星观测、共享及处理能力的发展,本文从森林火灾卫星遥感监测的基本原理、当前可用中高空间分辨率卫星数据及其特点、中高分辨率森林
[目的/意义]选取国内外15家科学数据中心的科学数据质量评价指标,旨在筛选能够客观反映科学数据质量的共性指标,构建具有普适性的科学数据质量评价指标体系.[方法/过程]采用
[目的/意义]古籍编目是古籍保护的核心内容和基础工作,“中华古籍保护计划”实施13年来,我国图书馆古籍编目工作取得了很大进展,同时也面临很多问题,这些问题应当引起国家层
[目的/意义]需求一直是提高服务质量和服务水平的关键所在,从客户需求视角探究有效的知识服务方式对于保障智库的知识服务质量,提高智库的服务水平和影响力具有重要意义.[方
[目的/意义]研究以科学数据为信息载体,探究用户在进行数据检索时,影响其进行相关性判断的标准的使用特征,从而进一步探究科学数据用户的信息行为,为完善数据检索平台和加强
自约瑟夫·熊彼特提出“创新理论”,认为创新是企业获取超额利润的关键,是经济发展的根本动力之后,众多学者开始从不同角度、不同层面研究创新问题。在经济全球化、新技术革命形势的力推下,作为创新的重要主体—企业,有效利用创新方法,降低生产成本、提高生产效率、增强创新凝聚力,将对我国企业的发展乃至整个社会的和谐稳定发展具有重要意义。企业采用的创新方法往往是自己总结归纳,或者直接引进来自外部的优秀方法,对企业
[目的/意义]通过政策计量视角观察当前我国公共文化服务政策环境全貌,优化公共文化服务政策设计,提供政策、研究、实践等板块之间进行比较的思路与资料库.[方法/过程]收集公