实体和属性对齐方法的研究与实现

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:bruce_8_8_8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网技术的不断发展,网络信息呈爆炸式增长。人们在通过互联网快速、自由地获取信息的同时,也面临着如何从海量数据中快速精确地获取用户所需信息的难题。知识图谱通过构建知识来理解用户的查询意图,并发现令用户满意的搜索结果。实体对齐和属性对齐是知识图谱构建、Web挖掘和智能信息处理等领域的重要研究问题,该技术可应用于信息检索、问答系统、自动摘要等领域。本文主要研究面向在线百科的实体对齐和属性对齐方法。实体对齐任务是指将不同数据源但是含义相同的多个实体进行对齐。属性对齐任务是指将表示同一概念的属性进行合并。针对实体对齐问题,本文提出了一种基于多视图融合的实体对齐方法。该方法的基本思想是同时利用两个视图的模型进行实体对齐,融合了自由文本视图和消息盒视图。它的优势是从多个角度解决实体对齐问题,考虑了多种视图的共同性和互补性。针对属性对齐问题,本文提出了一种基于词向量的属性对齐方法。该方法的基本思想是通过Word2vec及词向量技术去挖掘网页文本中的潜在语义信息,并融合对齐实体的相似属性。它的优势是有效地利用了深层语义信息和短文本知识,从而提升属性对齐的效果。本文实验数据选用百度百科、互动百科和维基百科三大在线百科的旅游景区、保护动物、人物明星和世界国家四个主题的中文网页语料。评估指标采用的是准确率、召回率和F值。实验结果表明,基于多视图融合的聚类实体对齐方法优于单个视图的实体对齐方法,基于多视图融合的BIRCH层次聚类实体对齐方法优于基于多视图融合的LDA主题模型实体对齐方法和基于多视图融合的K-means聚类实体对齐方法;基于词向量的属性对齐方法优于基于相似距离的属性对齐方法。因此,实验结果表明了本文提出的实体对齐方法和属性对齐方法的有效性,该方法和所构建的实体和属性对齐知识可以广泛应用于构建知识图谱、知识库和知识计算引擎中。
其他文献
近几十年,在基因调控、蛋白质-DNA相互作用、DNA结构探针,以及癌症治疗方面,化学核酸酶具有广泛的研究前景和潜在的应用价值。设计和研究化学核酸酶已成为21世纪生物化学和药
该住宅位于纽约市下东城区(Lower EastSide)。设计之初建筑师面临巨大挑战——怎样才能同时满足纽约市住宅与商业的分区规定和开发商的商业需求。因此,我们将楼底设置为住宅区,而
房建项目管理关系到工程项目的顺利实施和经济效益,涉及内容广、难度系数高。有效的房建项目管理应该是兼顾成本管理、质量管理和进度管理三要素的工程管理,以不断提高房建企业
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
在建筑工程中,项目管理水平决定着工程整体施工水平和工程效益。因此,做好建筑工程项目管理工作至关重要。本文分析了建筑工程项目管理现状,并从管理人员、制度等方面提出了创新
目的探讨少见类型多发性骨髓瘤(MM)的临床特征。方法选择宁夏回族自治区人民医院2012年1月至2017年6月诊断的7例少见类型MM的病例,对其进行实验室检查和骨髓形态学及流式细胞
房屋建筑的质量直接关系到人民的生命和财产安全。进入新世纪后,建筑施工单位在施工过程中的质量管理工作直接影响到建筑物的质量。只有做好施工质量管理工作,才能为工程的顺利
目的:探讨分析应用中药治疗月经失调的临床疗效。方法:选取2009年1月~2012年12月间我院收治的月经不调患者120例作为研究对象,运用中医辩证疗法对其进行治疗,并将治疗的效果及所有
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的:优选贞栀颗粒中女贞子和白花蛇舌草的乙醇提取工艺。方法:采用HPLC测定特女贞苷、齐墩果酸和熊果酸含量。通过单因素试验考察影响特女贞苷转移率的因素,以特女贞苷和总