【摘 要】
:
产业知识图谱作为面向特定领域的知识图谱,可以帮助企业快速了解行业内的技术发展趋势和当前存在的研究难点。在产业知识图谱的构建过程中,如何获取作为核心节点的企业产品信息,并分析产品之间存在的关系是十分重要的环节。本文从企业发布的专利信息角度出发,探索了实体识别和关系抽取在构建产业知识图谱过程中发挥的作用,主要的研究工作如下:针对专利领域数据不足问题,标注了面向专利数据的实体关系联合抽取数据集。同时为了
论文部分内容阅读
产业知识图谱作为面向特定领域的知识图谱,可以帮助企业快速了解行业内的技术发展趋势和当前存在的研究难点。在产业知识图谱的构建过程中,如何获取作为核心节点的企业产品信息,并分析产品之间存在的关系是十分重要的环节。本文从企业发布的专利信息角度出发,探索了实体识别和关系抽取在构建产业知识图谱过程中发挥的作用,主要的研究工作如下:针对专利领域数据不足问题,标注了面向专利数据的实体关系联合抽取数据集。同时为了将预训练语言模型BERT更好地迁移到专利领域,对BERT进行了重新预训练,得到了专利BERT,各项对比实验验证了专利BERT的有效性。提出了一种基于多颗粒度文本表征的命名实体识别方法。该方法首次在模型内部实现了字、词、N-gram表征的结合,并通过N-gram编码器来提取其中的成词特征。在多种不同领域数据集上的结果显示,该方法在辅助识别实体边界问题上具有良好的性能,为进一步抽取实体关系奠定了基础。研究了在专利数据下的三元组生成问题,针对专利数据特有的实体重复现象,提出了融入位置和句法信息的实体关系联合抽取方法,通过利用实体位置和实体对间的依存关系,在模型训练阶段引入了更丰富的上下文信息。在专利数据集上的结果表明,使用专利BERT的改进方法与Baseline相比,在F1值上有24.59%的增幅。设计了面向专利领域的实体关系抽取系统,在辅助生成产业知识图谱、强化产业链方面提供了具体的思路和方案,具有重要的现实应用意义。
其他文献
近年来,导致危害人体健康的腹部器官病变和肿瘤的发病率逐年上升。腹部各个器官的体积与形态变化是腹部疾病的早期诊断指标,其主要诊断方式为计算机断层扫描技术。从人体腹部多组织CT影像中精确并高效地分割腹部器官能够提高医生诊断的准确度和效率。大多数基于深度学习的网络模型通常用来处理单器官的分割问题,其进行多组织分割任务时,会产生由于图像中含有大量无关背景、不同类型器官之间相互影响而导致的过度分割与分割准确
随着城市安防系统的迅速建设,摄像机的数量指数上升,采用人工方法在摄像机集群中追踪行人更加艰难,所以基于深度学习的多目标跟踪方法取得了迅速的发展。本文主要研究了一种非重叠视域多摄像机场景下对多个行人进行跟踪的算法,将其分为三个子问题进行研究,并提出优化和改进的方案。首先,为解决行人跨相机视域时因视角、光照影响导致特征表达能力不足的问题,提出了一种适应跨视域的特征提取算法。该算法将IBN块嵌入分类网络
随着信息技术的迅猛发展以及各种智能移动终端的普及,大规模的流式数据从各式各样的应用系统中不断产生和涌现,因此,针对流式数据的复杂事件处理技术成为了重要的研究课题之一,同时也受到了国内外研究者的广泛关注。然而在现有的复杂事件处理技术中,对简单查询模式下的复杂事件匹配处理方法都还存在着一定的局限性。针对现有的复杂事件匹配处理方法存在匹配代价高的问题,提出了一种在有序事件列表上选择更优匹配顺序进行递归遍
在中国共产党百年的历史进程中,调查研究工作方法起到了重要作用,为党和人民事业的发展不断做出贡献。习近平将调查研究工作方法融入到了治国理政的实践之中,提出了一些新见解、新论断,指导党和国家在脱贫攻坚、党的建设等方面取得历史性成就。当前,中国迈入了新的发展阶段,在新时代和大变局叠加的时代背景下,需要继续以习近平调查研究工作方法为指引,围绕重点问题展开研究,为建设中国特色社会主义现代化强国明确方向。文章
面对当今能源短缺和环境污染的问题,发展航空替代燃料成为航空领域的重要研究课题。乙醇作为一种清洁可再生的生物燃料,具有原料来源广泛、制备工艺简单等特点,受到了人们的广泛关注。燃料通过燃油喷嘴时的流动及雾化特性是影响燃烧室内燃烧特性的重要因素。离心式雾化喷嘴在航空发动机上得到了广泛应用,开展航空替代燃料在离心式喷嘴内的流动及雾化特性的研究对于推动航空替代燃料的应用具有重要意义。由于物性参数的差别,在航
近年来,乳腺癌的发病率逐年上升,严重影响全球女性的身体健康。随着医学影像技术的快速发展,核磁共振检查成为乳腺肿瘤早期检查的重要方式。乳腺核磁共振图像包括T1加权成像与T2加权成像两种方式。T1加权像突出乳腺解剖结构,T2加权像突出乳腺病理结构。在临床诊断中,医生经常需要同时对T1与T2图像进行观察,不仅耗时而且容易出现误诊。而T1及T2加权的乳腺MRI影像配准可以实现信息互补,简化医生诊断的难度。
神经机器翻译训练模型需要充足的语料,利用深度学习的方法构建翻译模型,在低资源场景下双语平行句对数量不足,导致训练的翻译模型结果不符合标准。而无监督神经机器翻译技术使用两种语言的单语数据训练模型,改善了双语数量不足训练模型出现的问题。目前无监督神经机器翻译技术有完整的训练流程,通过对无监督神经机器翻译技术分析,本文提出问题和改进方法,具体工作有下两个方面。第一,无监督神经机器翻译使用Transfor
高超声速风洞是高超声速飞行器进行地面吹风试验的重要设备。试验过程中,高超声速喷管的壁面受高温气流的对流和辐射传热影响,具有很高的热流密度。喷管结构在严重的热负荷条件下工作,特别是喉道段具有极严苛的温度、压力、气流冲刷和腐蚀性气氛。因此必须采用适当的冷却措施以保证喷管喉道段的生存性。在冷却系统的设计、优化和可靠性评估中,喷管的气侧传热系数是喷管传热分析和冷却设计的关键参数。本文分别采用边界层近似积分
刷式密封是具有优良密封性能的接触式动密封,刷丝在工作过程中与转子接触摩擦产生较高热量,热量在刷丝内部热传导使刷丝产生热应力及热变形,影响刷式密封的封严性能和使用寿命,开展刷式密封摩擦热效应研究具有重要价值与工程意义。本文从理论、数值与实验三方面开展研究。在理论方面,建立并分析刷式密封瞬态流固热耦合理论模型,研究刷式密封ALE算法理论;在数值方面,建立基于ALE算法理论的刷式密封瞬态流固热耦合数值模
医学影像中肝脏区域分割对于肝脏疾病诊断和治疗起到重要作用,因此对计算机断层扫描(Computed Tomography,CT)图像中肝脏分割的研究十分有意义。但由于腹部脏器的非刚性特征和复杂背景的影响,肝脏区域的灰度值与其周围组织的灰度值十分接近,这使得传统的图像分割方法很难准确确定肝脏边界。为有效解决上述问题,本文结合深度学习及水平集方法的优势,先利用深度学习获取肝脏的初始边界,再利用水平集实现