基于对象代理数据库的专利知识图谱构建方法研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:xujie880112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展和技术保护意识的逐渐提升,越来越多的专利获得了申请和授权。然而这其中的大部分专利,并没有得到很好地转化利用。因此,迫切需要对于专利数据进行有效管理。知识图谱在管理海量数据和复杂的关系上有很大的优势,在智能问答和信息检索等多个领域都有广泛的应用,尤其是面向特定领域的知识图谱。知识图谱利用实体间的关系构建知识网络,可以给这些细分领域提供高效的技术指导与帮助。因此,构建一个基于专利领域的知识图谱,对于专利知识管理拥有很大的意义。当前知识图谱管理方案主要有两类:一类是基于关系数据库的建模方案,基于关系数据库的存储方式有三元组表存储方式,六重索引方式,属性表存储方式以及DB2RDF等,这些存储方案构建不同的关系表实现实体和关系的建模,但是不可避免会存在表的连接操作,影响数据查询的效率;一类是基于图数据库建模方案,图数据库的存储方式是将实体和关系映射成图中的节点和边,其在多级跳跃查询时效率比较高,但是对于涉及大节点查询效率会比较低,而且分布式存储实现代价很大。对象代理数据库采用不同于传统关系型数据库的存储模式,将客观实体抽象为对象形式,具有相同属性和方法的对象归纳为一个源类。在源类上利用连接,选择和分组等操作可以生成不同的代理类。对象代理数据库的特点在于利用源类和代理类来构建数据间的语义关联,并通过跨类查询语句实现在对象之间语义查询。由于其丰富的语义表达能力,可以很好地表示专利中复杂的语义关系,对于专利领域复杂的语义网络可以进行很好的建模与表示。因此,本文利用对象代理数据库进行专利知识图谱的构建工作。针对当前知识图谱建模方式的一些局限性,本文提出基于对象代理数据库的专利知识图谱构建方法。首先,本文利用对象代理模型的SELECT、UNION、JOIN、GROUP这四种代理类进行知识图谱的建模工作。本文利用基本类存储专利数据中的基本关系,在基本关系上利用代理类完成对于专利数据中的选择、特化、泛化等关系的构建。本文的建模方式可以有效地解决表的连接操作过多的问题,提高查询效率,并且可以通过选择关系的构建有效地管理知识图谱中的关系丰富的实体。此外,在存储模式设计上,我们针对不同的数据类型构建不同的存储方案,以兼顾数据存储空间的压缩和数据查询效率的提升。在查询上,我们采用了跨类查询方案,并通过优化代理类的构建顺序来提高数据的查询效率。
其他文献
近几十年,环境的不断恶化造成人们对于清洁能源的需求逐年上升,太阳能的高效利用能够解决一系列人类活动所带来的能源危机与环境问题,研究和开发新型的功能材料是实现这一技
脱水素(Dehydrin,DHN)属于胚胎发育晚期丰富蛋白第二家族(LEA-II),是脱水胁迫响应基因的主要一类。干旱,高盐和低温等非生物胁迫会导致植物体内出现脱水胁迫,诱导脱水素大量表达,从而保护蛋白质、核酸和细胞膜等。然而,植物体内不同类型的DHN蛋白在植物生长发育及抵抗非生物胁迫过程中发挥的功能存在较大差异。新疆沙冬青(Ammopiptanthus nanus),作为一种强抗逆沙漠植被,探究
科学技术是第一生产力,是先进生产力的集中体现和主要标志。科技创新已成为世界各国政府推动经济社会发展的核心动力,对于现在的中国,科技创新也已成为最重要的内驱动力之一。因此,科技创新能力的提升不仅能提高社会生产力,更能激发区域经济社会发展的活力,进一步改善和提升人民生活水平。本文以S市S区为研究对象,结合S区政府科技创新管理现状,分析S区政府科技创新管理中存在的不足,并提出对策,以进一步提升S区政府科
作为最新的物理层安全方案的一种,二维传输方案在物理层保证了合法用户的安全性。然而,在保证安全的同时,二维传输方案中合法接收端的性能变差。针对该问题,本文提出了用于二维传输的信道编码方案。该方案用二维传输方案中的信道系数矩阵构造QC-LDPC码的奇偶校验矩阵的基矩阵。这样做的原因在于:首先,二维传输方案的信道系数具有互异性,唯一性,即时性,这三个性质保证每一次传输的符号是随机的,并且使得只有发送和接
近年来,由于能源匮乏以及日益严重的环境污染问题,严重阻碍了人类社会的生存发展。因此,探索新的绿色可再生能源是寻求可持续发展所亟待解决的重要问题。利用半导体材料将充
新型室温磁制冷材料的研制是当前磁学和制冷技术研究的前沿课题之一。本文工作利用X射线衍射仪、振动样品磁强计、差示扫描量热仪、扫描电镜等研究了Mn1.3Fe0.6P0.5-xBxSi0.5(x=0,0.02,0.04,0.06)系列化合物、MnFe0.6Ni0.4Si1-xGa(x=0,0.05,0.06,0.07,0.08,0.09,0.10,0.15,0.20)系列化合物和MnFe(P,Ga)化合
通过分析北京谱仪Ⅲ(BESⅢ)实验在质心能量(?)=3.773 GeV处采集的积分亮度为2.93 fb-1正负电子湮灭数据,我们完成了十四个D介子到含η末态多体强子衰变过程(D→ηX)的分支比
与传统合金由12种主要组元构成不同,近些年发展的高熵合金包含5种或5种以上组元,且每种组元含量在5%35%之间。这一新颖的设计理念为冶金发展提供了新的研究方向,并为合金成分
回旋管作为一种高功率微波源,在工业和国防方面有着非常重要的应用。回旋管内部通过准光模式变换器将旋转的高阶模式转换成为便于传输和利用的横向高斯光束。为了检验准光模式变换器的性能,需对其进行低功率测试。冷测的一个重要环节就是激励出用于测试的源场,国内外广泛应用了两种产生该源场的方法,分别是波导模式激励法与准光模式激励法。前者具有较好的模式转换效率,适合激励产生频率较低的低阶模。后者虽然转换效率不高,但
纤锌矿氮化物(GaN,AlN和AlxGa1-xN)是一种重要的宽禁带半导体,具有良好的化学稳定性和热稳定性,被认为是最有前途的纳米电子和光电材料之一。GaN基量子阱材料已经应用于激光