企业专利推荐研究:多源数据融合视角

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:xf1005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球专利数量的快速增长,企业如何快速发现与自身技术发展和创新战略高度相关的专利就变得愈发重要。目前企业在海量的数据库中查找专利主要使用IPC(International Patent Classification)分类号、技术领域关键词或二者之间的组合,然而这些传统方式检索到的专利数据不可避免包含大量噪声,一方面IPC分类号有时显得过于宽泛,而基于领域关键词的布尔查询也很难精准覆盖企业的所有技术领域,另一方面对于企业具体的研发或知识产权管理人员而言,其个人知识储备往往也很难完全满足整个公司的技术发展战略需求。因此,面对快速增长的海量专利数据,企业如何及时高效地识别出与企业自身技术发展战略高度相关的专利、提高企业管理决策效率,从而提升竞争优势,就成为当前信息管理和信息系统研究领域的重要课题之一。针对上述管理科学问题,基于企业技术偏好的专利推荐逐渐成为当前主流的解决方案之一,但是在专利推荐过程中,如何及时高效地为企业找到符合其创新战略和技术偏好的专利依然存在较大挑战,其中如何对海量专利文本进行自然语言处理就是关键问题之一。2019年以来,相较于传统的词袋模型和静态预训练模型,以BERT(Bidirectional Encoder Representations from Transformers)为代表的动态预训练模型可以更加准确挖掘出文本的内在上下文信息,并更好地解决一词多义问题。与此同时,考虑到专利数据的滞后性和单一性的局限,本文将多源数据融合理论引入到企业专利推荐领域,可以更为全面地分析和把握企业技术偏好和技术发展战略等动态信息,从而可以为企业提供更加合理有效的专利推荐。本文的主要创新点:(1)目前国内外关于动态预训练模型和专利推荐相结合的研究较少,本文将二者结合的研究结果显示,动态预训练Pub Med BERT模型在专利推荐领域效果较好,专利推荐查准率高达88%,显著优于目前专利文本挖掘领域常用的TFIDF以及Doc2Vec模型;(2)本研究将多源数据融合理论应用到企业专利推荐领域,提出了一种多源数据融合视角的企业专利推荐框架。通过收集企业描述、专利、推特、招聘等多源数据,不仅可以更好识别企业技术偏好,还可以巧妙地解决新用户推荐“冷启动”问题。
其他文献
众所周知,微纳尺寸的光子器件可以将光场束缚在亚波长的尺度内,从而有效地增强光与物质的相互作用。非线性光学频率转换技术作为拓展激光工作频谱的关键手段,广泛应用于新光源产生、光学通信、全光计算、光学传感等领域。在微纳尺度或集成光子学范畴内研究高效的非线性光学频率转换是现代光子学领域的研究热点之一。光波导得益于其对光子的独特传导和束缚特性,是光子集成回路的核心器件。随着光波导制备技术与各种光学材料的不断
学位
车联网(Vehicular Network,VN)与人工智能技术的发展促进了无人驾驶汽车的网联化与智能化,智能网联汽车是未来智慧城市(Smart City)系统中重要的组成部分。智能网联汽车依靠自身传感器对周围环境进行感知,通过无线通信技术与其他智能网联汽车交互,最终将感知信息与通信信息结合做出智能决策。然而,由于道路参与者的增多以及天气、道路情况的影响,智能网联汽车的感知能力与通信服务质量面临着
学位
数字经济取得的巨大成就离不开数据这一关键生产要素。互联网用户作为数据主要生产者,其参与活动产生了海量数据,互联网用户的参与活动能否看作数字劳动、它是否创造价值就成为迫切需要解决的问题。研究这一问题对于揭示互联网企业巨额利润来源的秘密,在数字时代坚持和发展马克思劳动价值理论具有重要意义。分析互联网用户参与活动是否创造价值是本文开展研究工作的主线。首先,基于马克思主义唯物史观的基本立场重新认识创造价值
学位
顶层设计是中国促进经济发展的重要动力,也是指导新时代改革深入的宏观效能。不谋全局者,不足谋一域。中国对外面临世界未有之大变局,对内实现中华民族伟大复兴的战略全局的时代背景之下,意味着需要打通国内经济的生产、分配、流通、消费四个环节,利用中国超大规模市场的优势。党的十八大以来,习近平站在谋全局的高度,以顶层设计为首要,统筹国家事业各领域、设计经济社会各环节。国家大政方针的掌控从面面俱圆日渐转为抓大放
学位
为解决在电子档案管理过程中存在丢包率和电子文件归档等问题,基于Web技术设计开发了一种新型电子档案管理系统。首先,阐述了用户对电子档案管理系统的需求,并在此基础上进行系统总体架构设计,其次对系统的硬件设计以及主要功能模块进行设计。最后为了验证该系统的可行性,利用传统档案管理系统与本文系统进行对比,结果证明基于Web技术的电子档案管理系统的应用,不仅可以促进档案管理的效率得到提高,还为电子档案信息安
期刊
集成电路产业是我国战略性新兴产业,是各国在高科技实力博弈中必争的战略制高点。嵌入创新网络可以为集成电路企业提供丰富的内外部资源,而人力资本是企业创新的重要因素。因此,集成电路产业组织在提升自身技术研发能力的同时,可以通过加快嵌入外部网络和获取人力资本流动优势提高创新绩效。因此,探讨集成电路产业网络嵌入性、人力资本流动与创新绩效的作用关系具有重要的学术和现实意义。本文基于网络组织理论、社会网络理论和
学位
MAX相材料是指三元过渡金属碳/氮化物,化学式为Mn+1AXn,其中M为前过渡金属,A为第三、四主族元素,X为碳或氮,n=1-4。去除MAX相层间的金属层可以得到二维过渡金属碳/氮化物材料MXene。由于其特殊的二维层状结构导致的奇特的物性,迅速成为了跨学科的研究热点。特别的是,在Nb2C-MXene中发现了依赖于官能团的超导电性,但文献中关于Nb2C-MXene的超导电性在实验和理论上出现了一些
学位
新零售环境下线上线下加速融合,涌现出新的生鲜供应链模式为消费者提供更加便捷、高质量的生活方式,前置仓模式、到店+到家模式、社区团购模式、020模式、周期购模式等模式利用各自优势为用户带来便捷,同时零售商之间需要通过产品新鲜度、价格、投入成本等的竞争来获取用户实现利润最大化,本文重点研究线上渠道零售商,双渠道零售商、社区团购渠道零售商在市场竞争博弈中处于主导地位和跟随地位时的定价决策,使得零售商利润
学位
在“双减”理念和新高考模式下,教师给学生布置课后作业不仅要巩固学科知识、还要培养学科关键能力和学科核心素养。本研究的高中生物学“双减”课后作业是指课后作业练习题的题量和学生完成课后作业练习题的时间都要减少,提高作业内容质量,采用不同评价方式促进学生学习情况的有效反馈,提升教学效果。本研究通过文献研究法进行“双减”课后作业相关概念及理论研究。借助文献分析、学生问卷和教师访谈调查高中生物学课后作业现状
学位
银杏果是银杏树的果实,具有多种营养成分,被广泛应用于食品、保健和制药工业领域。然而新鲜的银杏果湿基通常在50%—80%之间,容易发生变质使营养成分流失,导致其不耐存储和运输。干燥是目前传统的食品储存方法之一,其原理是通过减少果蔬的水分含量和抑制微生物的繁殖,提高产品的保质期。目前干燥仪器成本最低的为热风干燥方法,然而传统的热风干燥方法存在温度过高破坏果蔬营养成分和品相的缺点,为了解决以上问题,本文
学位