基于改进Word2vec-GLDA的专利挖掘方法及应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:learn_vb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对全球激烈的竞争及技术垄断的局势,积极引导科技创新活动开展以寻求技术机会,成为企业及国家维持、提高市场竞争力的重要战略任务。专利文档作为创新活动产出的有效证明材料,囊括了全球不同国家90%以上的创新实践成果。通过专利数据挖掘可以为企业和国家制定创新发展战略提供重要情报信息。传统的专利分析研究多使用计量统计的方法,忽略了专利文本中的核心技术表达。随着深度学习和自然语言处理技术的发展和成熟,文本挖掘成为热门的研究方向。在专利文本挖掘领域,由于专利文本半结构化及长短文本结合的特征,直接应用深度学习相关模型进行专利文本的深层次分析,往往效果不佳。基于以上原因,本文以专利文本为挖掘对象,考虑专利的语义和文本特征,提出了适用于专利领域的文本挖掘方法。本文迁移学习短文本挖掘模型的思想,将IPC分类号与专利标题这类核心主题类短文本进行主题词拓展,并结合词向量Word2vec与GLDA(Gaussian Latent Dirichlet Allocation,GLDA)构建深度主题特征提取模型。通过GLDA模型为专利文档的关联特征建模,使用Word2vec词向量为词汇间的相似性建模,从而使模型能够同时表达文本的全局特征和局部特征。同时,通过主题词汇拓展有效区分了不同词汇的主题表达贡献度,突出专利文本中的关键主题信息,有效处理了专利标题等主题语句存在的稀疏性问题,提高了文本向量表示的准确性。实验结果证明,本文提出的基于主题词拓展的改进Word2vec-GLDA主题概率模型在专利领域的文本挖掘任务中具有相对优势。接着,基于特征主题挖掘模型获得的专利及主题向量数据,构建主题网络并从专利综合质量以及主题网络影响力两方面识别核心技术主题,进一步对相关领域的技术发展路径做出判断。同时,在专利文本向量的基础上,计算专利的相似度矩阵,构建可视化专利地图等知识图谱,并通过对专利地图中的异常专利进行筛选、梳理和总结,可对技术未来的发展做出合理的预测。最后,将以上提出的专利挖掘方法运用到智能制造领域,对该领域中的核心专利、技术演化、技术的未来发展趋势做了系统的分析,研究结果可以为智能制造产业的创新发展做出规划指导。
其他文献
顶层设计是中国促进经济发展的重要动力,也是指导新时代改革深入的宏观效能。不谋全局者,不足谋一域。中国对外面临世界未有之大变局,对内实现中华民族伟大复兴的战略全局的时代背景之下,意味着需要打通国内经济的生产、分配、流通、消费四个环节,利用中国超大规模市场的优势。党的十八大以来,习近平站在谋全局的高度,以顶层设计为首要,统筹国家事业各领域、设计经济社会各环节。国家大政方针的掌控从面面俱圆日渐转为抓大放
学位
为解决在电子档案管理过程中存在丢包率和电子文件归档等问题,基于Web技术设计开发了一种新型电子档案管理系统。首先,阐述了用户对电子档案管理系统的需求,并在此基础上进行系统总体架构设计,其次对系统的硬件设计以及主要功能模块进行设计。最后为了验证该系统的可行性,利用传统档案管理系统与本文系统进行对比,结果证明基于Web技术的电子档案管理系统的应用,不仅可以促进档案管理的效率得到提高,还为电子档案信息安
期刊
集成电路产业是我国战略性新兴产业,是各国在高科技实力博弈中必争的战略制高点。嵌入创新网络可以为集成电路企业提供丰富的内外部资源,而人力资本是企业创新的重要因素。因此,集成电路产业组织在提升自身技术研发能力的同时,可以通过加快嵌入外部网络和获取人力资本流动优势提高创新绩效。因此,探讨集成电路产业网络嵌入性、人力资本流动与创新绩效的作用关系具有重要的学术和现实意义。本文基于网络组织理论、社会网络理论和
学位
MAX相材料是指三元过渡金属碳/氮化物,化学式为Mn+1AXn,其中M为前过渡金属,A为第三、四主族元素,X为碳或氮,n=1-4。去除MAX相层间的金属层可以得到二维过渡金属碳/氮化物材料MXene。由于其特殊的二维层状结构导致的奇特的物性,迅速成为了跨学科的研究热点。特别的是,在Nb2C-MXene中发现了依赖于官能团的超导电性,但文献中关于Nb2C-MXene的超导电性在实验和理论上出现了一些
学位
新零售环境下线上线下加速融合,涌现出新的生鲜供应链模式为消费者提供更加便捷、高质量的生活方式,前置仓模式、到店+到家模式、社区团购模式、020模式、周期购模式等模式利用各自优势为用户带来便捷,同时零售商之间需要通过产品新鲜度、价格、投入成本等的竞争来获取用户实现利润最大化,本文重点研究线上渠道零售商,双渠道零售商、社区团购渠道零售商在市场竞争博弈中处于主导地位和跟随地位时的定价决策,使得零售商利润
学位
在“双减”理念和新高考模式下,教师给学生布置课后作业不仅要巩固学科知识、还要培养学科关键能力和学科核心素养。本研究的高中生物学“双减”课后作业是指课后作业练习题的题量和学生完成课后作业练习题的时间都要减少,提高作业内容质量,采用不同评价方式促进学生学习情况的有效反馈,提升教学效果。本研究通过文献研究法进行“双减”课后作业相关概念及理论研究。借助文献分析、学生问卷和教师访谈调查高中生物学课后作业现状
学位
银杏果是银杏树的果实,具有多种营养成分,被广泛应用于食品、保健和制药工业领域。然而新鲜的银杏果湿基通常在50%—80%之间,容易发生变质使营养成分流失,导致其不耐存储和运输。干燥是目前传统的食品储存方法之一,其原理是通过减少果蔬的水分含量和抑制微生物的繁殖,提高产品的保质期。目前干燥仪器成本最低的为热风干燥方法,然而传统的热风干燥方法存在温度过高破坏果蔬营养成分和品相的缺点,为了解决以上问题,本文
学位
随着全球专利数量的快速增长,企业如何快速发现与自身技术发展和创新战略高度相关的专利就变得愈发重要。目前企业在海量的数据库中查找专利主要使用IPC(International Patent Classification)分类号、技术领域关键词或二者之间的组合,然而这些传统方式检索到的专利数据不可避免包含大量噪声,一方面IPC分类号有时显得过于宽泛,而基于领域关键词的布尔查询也很难精准覆盖企业的所有技
学位
马克思反贫困理论以资本主义工业化大生产带来的无产阶级贫困为背景,中国乡村减贫实践以社会主义制度下的农民贫困问题为背景,那么面对时代场域变化带来的理论与现实之间的不一致,马克思反贫困理论在中国乡村减贫中是否还具有现实价值?通过研究马克思反贫困理论和中国乡村减贫背景与路径,研究认为中国乡村减贫实践对马克思反贫困理论所蕴含的立场、途径和理论旨趣进行了理论继承。中国乡村减贫实践立足于中国制度变化的历史现实
学位
扩大从“一带一路”沿线国家进口农产品有助于多元化我国农产品进口来源、防范农产品进口风险。然而,目前我国从“一带一路”沿线国家进口农产品的规模还较小,2009-2019年在中国农产品进口总额中仅占20%左右。相关研究表明,贸易便利化通过提高口岸效率改善制度环境和海关环境、发展电子商务等途径,可能有助于促进一国进口。因此,本文研究了贸易便利化对我国从“一带一路”沿线国家进口农产品的影响,利用2009-
学位