专利检索与核心专利识别方法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:DreamerL
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专利是重要的知识财富,通过研究专利可以找到重要的技术细节和关系,这些信息和关系为制定研发策略提供有价值的信息。因此有必要进行专利检索和核心专利识别方法的研究。但随着专利数量增加,专利检索成本以及核心专利识别难度也日益增加,主要原因在于专利描述文本自身的特点,如专利文本冗长,专利描述中充斥着各种技术和法律术语等。为了提高检索质量以及准确度,通过核心专利推演关键领域未来的发展趋势,论文以专利文本作为研究对象,从专利查询扩展、专利文本相似度以及核心专利识别等方面开展研究,主要内容包括以下方面:1.为了获取用户完整的查询意图,提高检索查询的准确率和召回率,提出一种基于社区发现的专利查询扩展方法,该方法建立以专利主题词为节点,主题词之间关系为边的专利主题词图,将专利查询扩展问题转化稠密子图搜索问题,利用社区发现算法实现问题求解。在专利数据集CLEP-IP 2010上,与查询扩展的基准方法相比,实验结果表明该方法是可行和有效的,方法召回率提高约7.1%,PRES改善了近3.2%。2.为了提升专利检索的准确性,提出基于BERT的上下文感知专利检索模型。综合专利文本中多类型的内容,利用BERT获得专利文本特征,在提取匹配信息时考虑专利上下文关系,使用RNN对上下文进行编码,用卷积网络提取词项之间的依赖关系,然后获得度量专利文本的相似度匹配值。实验结果表明该方法是可行且有效的,在专利数据集CLEP-IP 2010上进行实验,在p@20和n DGC@20上均优于基准的信息检索模型,分别提高了5.3%和9.1%,进一步说明了基于上下文感知的专利检索模型能更好的构建精确的专利文本的语义表示。3.为了从大量相关的专利文件中确定代表相应技术领域中主导技术的专利,提出了基于最小成本连通支配集的核心专利发现方法。构建专利信息混合图,表示专利之间的关系,将核心专利发现问题建模为最小成本支配集的问题,通过基于免疫机制的二元粒子群算法的优化算法IBPSO找到最小成本集获得核心专利集合。在真实专利数据集上进行实验,实验结果表明本方法在top@50的查找任务上召回率高达到83%,验证了算法的可行性和有效性。
其他文献
本文针对免烧结陶粒密度较大的问题,提出了利用减重材料制备轻质免烧陶粒的方法,并且围绕轻质免烧陶粒,展开了轻集料混凝土的力学性能、保温性能、内养护性能和高硫渣轻集料膨胀性能的研究。制备了轻质免烧硅酸盐轻集料。利用漂珠、膨胀珍珠岩颗粒、膨胀珍珠岩粉末、粉煤灰和水泥作为原材料,利用绝对体积法设计轻质免烧结轻集料,在1MPa,180℃水热合成8h的条件下,制备出3种轻集料:漂珠硅酸盐轻集料(Floatin
近年来,微型涡喷发动机被广泛应用于各种小型作战武器以及无人机上,微型涡喷发动机具有体积小、重量轻、可靠性高等优点。作为精确打击小型作战武器的动力供应系统具有很重要的研究价值。因此本文针对某型微型涡喷发动机的工作特点,对其控制需求进行分析,并根据控制器的控制需求设计该控制器的整体方案,对控制系统的硬件以及软件部分进行设计并完成PCB布板和实验。为提高微型涡喷发动机的转速控制系统的鲁棒性和响应速度,采
超空泡减阻技术在水下高速航行体的研究中应用广泛,对该技术的研究主要包括数值仿真和实验研究两方面,其中,由于超空泡本身复杂的流场特性,实验研究是评估航行体水下运动性能的重要手段。超空泡射弹水槽实验研究相较仿真研究,其空化现象与实际应用更为相近,但由于其发射状态不易控制、试验条件受限及分析方法缺乏等,取得的成果有限。本文针对目前对水中高速射弹空泡形态及弹道参数精确测试能力的不足,搭建了一套能够对超空泡
逆变器是一种将直流电转换为交流电的电能变换装置。多电平逆变器具有开关管电压应力低、输出电压质量高以及电磁干扰小等诸多优势受到广泛研究。相对于传统多电平逆变器而言,双向高频隔离多电平逆变器结合了高频链技术和多电平逆变技术,不仅具有多电平技术的诸多优势,还兼具有高频电气隔离、双向功率流等优点。目前,双向高频隔离多电平逆变器主要采用基于双有源桥的两级式架构。两级式架构由高频隔离DC-DC和全桥DC-AC
随着图像数据的日益增长,图像近似搜索(又称图像检索)扮演着越来越重要的作用。在过去的几年里,监督的图像检索可以获得令人满意的效果,然而由于带标签数据集的稀少以及人工标注的成本太高,无监督的图像检索成为主要关注点。为了节省存储空间,本文研究稀疏图在无监督图像检索中的应用,致力于在节省空间的同时提高图像近似搜索的精确度。该技术目前有以下三个主要问题需要解决:(1)标签信息缺失情况下的近邻信息挖掘问题。
目前,黑磷作为一种新型的二维层状半导体材料,具有石墨烯等其他二维材料不具备的优异性能,如高电子迁移率和开关比、具有直接带隙,良好的生物安全性等等,这使其在生物、医疗、光催化等领域有着广泛的应用潜力。本文基于上述优点对黑磷在光动力学治疗领域的应用进行了研究,首先对制备黑磷量子点的工艺进行了探索,采用液相剥离的手段获得黑磷量子点(BPQDS),并通过高分辨透射电子显微镜(TEM)、拉曼光谱仪(Rama
随着遥感对地观测技术的发展,单一类型的遥感图像已经无法满足逐渐增长的应用需求,而不同类型的遥感数据的之间会存在一定的差异性和互补性,因此越来越多的学者将目光转向了多源遥感数据的协同分类。在众多类型的遥感图像中,高光谱图像以其精细的光谱分辨率在地物分类中占据重要的地位,但高光谱图像普遍存在空间分辨率低的问题,空间分辨率的不足导致图像中会存在较多的混合像元,这给地物的精细分类带来了极大的干扰。因此,本
冲压加速器是一种利用混合气体推进剂的化学能,将弹丸加速到高超声速的新概念推进装置。推进剂的反应速率和放热量较高时,火焰阵面会向弹丸前体移动,并越过弹丸肩部,对弹丸产生阻力,产生不启动现象。当弹丸肩部表面存在激波反射点时,激波后方的高压区对火焰的传播有一定的阻塞作用,能够扩大推进剂的反应速率范围。根据这一思想,本文基于粘性理想气体假设,采用SST k-ω湍流模型、有限速率/涡耗散模型和甲烷-氧气单步
运动想象脑电信号是由大脑进行想象运动时激发的信号。基于运动想象脑电信号控制的脑机接口(Brain Computer Interface,BCI)系统可以直接将大脑想象的运动意图解码为控制指令,完成对外部设备的控制。作为一种新型人机交互技术,BCI系统可以应用于多种场景,但是实际应用中基于运动想象脑电信号的BCI系统存在着:运动想象脑电信号种类少、多分类任务的识别准确率低和实时传输速率慢等问题。为实
由于通讯网络连结了网络空间及实体空间,因此网络化控制系统可以在长距离下执行许多任务。而且,网络化控制系统的信息都透过共享的网络传输,省去了不必要的配线,减少系统复杂度,也降低了设计及架设系统需要的成本。若要增加传感器、控制器或是执行器来调整或是更新系统,也可以用较低的成本达到,而且不会变动系统的主架构。因此,与传统的控制系统相比,网络化控制系统有无与伦比的优势。在此基础上,本文研究了基于采样数据的