语义Web中对象共指识别方法的研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:fymgxlj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了实现不同组织和应用程序之间的数据集成和共享,万维网联盟(W3C)提出了语义Web的设想。随着语义Web的发展,很多领域都出现了被人们普遍认可的本体,比如社交领域的FOAF本体。因此在数据发布时,人们能够使用共同的统一资源标识符(URI)来标识本体中的概念和属性。然而,在实例数据层,由于语义Web的分布式特性,不同的数据源使用不同的URI来标识相同的现实世界对象的情况大量存在。这种不同的URI但指称着相同对象的现象称为对象共指,导致了语义Web数据分散不容易集成。为了构建更好的数据网络和实现数据源之间的互操作性,迫切需要有效的方法来识别出这些共指的URI。   目前,在链接数据(Linked Data)的驱动下,针对对象共指的研究已经引起了语义Web社区的广泛关注。本文针对语义Web环境下的对象共指问题,从两个不同的角度提出了两种共指URI的识别方法:面向实例数据集的共指识别方法和大规模的语义Web共指识别方法。前者从包含实例对象的数据集出发,综合利用对象本身的信息和对象之间的语义关系,即首先根据实例对象的文本信息计算初始相似度,然后再利用实例之间的语义关系构建候选实例对的依赖关系图,进而对初始相似度进行精化,最终识别出数据集中的共指URI。后者则是从整个语义Web的角度出发,充分利用语义Web数据的特征,通过分析具有特定性质的语义属性导出URI间的语义等价关系,然后通过迭代的方式识别出语义Web中大规模的共指URI的集合。   基于以上的方法,本文设计与实现了一个共指URI识别的在线系统ObjectCoref。此外,设计相关实验对识别方法的效果进行评估,结果表明本文提出的识别方法在实验中是行之有效的。
其他文献
长期以来,织物CAD技术一直是计算机在纺织领域中的一个重要应用与研究方向,织物CAD作为高新技术的手段为纺织品的设计和生产提供了很大的方便。织物的外观模拟在设计阶段就能
本文研究相关分析方法在异常检测中的应用,并将其应用于特征选择及地震特征数据的异常检测中。主要研究内容如下:提出了一种基于离散粒子群算法(Binary Particle Swarm Optim
计算机科学与技术的不断发展和计算机的广泛应用,促进了社会的进步和繁荣,给人类创造了巨大的财富。尤其是计算机网络的发展,日新月异,使信息共享广泛用于金融、贸易、商业、企业
当前国内的网络安全事件频频发生,垃圾邮件的泛滥成为其中显著的特点之一。传统的反垃圾邮件方法以基于内容的过滤为主,按照基于统计和基于规则划分为多种算法。但这些方法都
随着医学影像诊断技术的逐渐成熟,大量医学图像数据随之产生。这些海量图像的出现极大地丰富了医学工作者和科研人员的参考、教学和研究,然而怎样对如此大量的图像数据进行有
红眼是使用闪光灯拍摄照片时的常见现象。人类的瞳孔在环境光线不好的情况下会放大。在这种情况下使用闪光灯拍照时,人的瞳孔来不及收缩,光线直接穿过瞳孔照射在视网膜的微血
互联网技术的应用和普及把我们带到了网络信息的时代,用户在面临海量资源共享的同时对需要精确获取的信息反而束手无策。为了解决信息检索中难以满足个人独特需求的问题,个性
随着互联网的普及,过去的几年里,网络上的数据快速增长。对机器学习来说,大量的数据意味着可以训练更加复杂的模型,模型的泛化能力也得到提高,但同时,模型在训练和使用阶段的
粗糙集理论是波兰数学家Z.Pawlak于1982年提出的一种分析不完整、不确定、不精确数据的有效的数学理论。它与其它处理不确定或不精确问题理论有着最为显著的区别,那就是不需
远程会诊是医疗机构之间运用先进的多媒体通讯手段,完成远程异地医疗会诊目的的一种服务方式。在整个会诊过程中,实现专家与远程患者信息的实时交互是至关重要的一环。   本