利用海量知识库实现实体标注的一种方法

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:RRR6670
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网上聚集了大量的文本、图像等非结构化信息,RDF作为W3C提出的互联网上的资源描述框架,非常适合于描述网络上的非结构化信息,因此形成了大量的RDF知识库,如Freebase、Yago、DBPedia等。RDF知识库中包含丰富的语义信息,可以对来自网页的名字实体进行标注,实现语义扩充。将网页上的名字实体映射到知识库中对应实体上称作实体标注。实体标注包括两个主要部分:实体间的映射和标注去歧义。利用海量RDF知识库的特性,提出了一种有效的实体标注方法。该方法采用简单的图加权及计算解决实体标注的去歧义问题。该
其他文献
蔡元培、徐宝璜和邵飘萍分别是北京大学新闻学研究会的主要创始人和重要导师,他们的新闻实践、教育活动促成了北大新闻学研究会的新闻教育理念,对中国刚刚起步的新闻教育有着
<正>说到"文艺",首先会想起"文艺复兴"。意大利文艺复兴中的"文艺"两个字的含义,和我们今天的"文艺学"里的"文艺"的含义差异非常大。意大利语中"文艺"到底指什么,由于不同语
随机早期检测算法RED作为一种重要的主动队列管理算法,通过有效地控制队列长度,取得较好的吞吐量性能。然而,当多个业务流存在不同优先级时,不能很好地区分服务质量。提出一
相联存储器是集成电路中对软错误最敏感的部件之一,但是其结构特点决定了不能使用错误保护码等传统容错方法进行保护。提出了一种容软错误的相联存储器结构TM-CAM,通过采用三值
乘潮水位计算是海洋环境信息处理的重要组成部分,具有计算量大、计算复杂度高、计算时间长等特性。采用传统集群计算模式实现乘潮水位计算业务,存在计算成本高、计算伸缩性和交