【摘 要】
:
命名实体识别是自然语言处理的基础性任务,其结果具有广泛的应用。关联数据由于具有丰富的语义知识,能够对现有命名实体识别进一步完善。本文实现了一个基于关联数据的可配置
论文部分内容阅读
命名实体识别是自然语言处理的基础性任务,其结果具有广泛的应用。关联数据由于具有丰富的语义知识,能够对现有命名实体识别进一步完善。本文实现了一个基于关联数据的可配置的中英文命名实体识别系统,在识别过程中对实体进行消歧并对识别结果进行扩展,为命名实体识别的进一步完善提供了新的思路。具体包括:基于DBpedia构造了跨领域的中英文命名实体词典;设计了一个基于Hive的分布式管理数据存储模型,基于该模型实现了对DBpedia数据集的组织、存储以及扩展;设计了一个基于图的命名实体识别算法,该算法能够充分利用关联数据的语义关系对命名实体进行消歧,并且基于DBpedia Spotlight NER Corpus对算法进行测试,并将算法结果与DBpedia Spotlight、NERSO以及Zwmanta三个系统进行对比评价,结果表明本文实现的算法在查全率、查准率、F值上具有更好的表现。
其他文献
产业结构调整是现在我国经济发展过程中急需解决的重要问题。建立一个合理的产业结构是提高人民物质文化生活水平以及推进经济和社会发展的必要过程和努力方向。金融作为资源
伴随高教大众化和高校后勤社会化的潮流,学生公寓在学生管理中的地位越来越重要。高校思想政治工作者应按照高校党建工作的目标和要求,结合大学生公寓的具体情况,积极探索学
探讨了装备供给与价格关系、装备需求与价格的关系,并在此基础上,将装备供给、需求结合起来分析其与价格之间的相互关系;首选从静态上分析装备供给与装备价格、装备需求与装
通过测试正反向陈述的NEO-FFI和EPQ,探讨了中国高中生中默认、极端化、折中化、弹性反应风格的特点,及题目陈述方向的改变对其人格测验信效度的影响。结果发现反应风格在中国
ARC8P型耐磨带焊机是对加重钻杆和钻杆等石油钻具产品进行耐磨带自动敷焊的设备,早期的焊机在敷焊过程中耐磨带环接口处存在凹槽缺陷,本文通过增设部分PLC外围控制电路,同时
利用现代信息技术辅助课外阅读指导课,提升课外阅读的实效是目前阅读教学研究的方向。在课堂教学中,教师要利用信息技术创设情境、激发兴趣,建构晨诵教学、课外阅读导读课的
随着高等职业教育规模的壮大、后勤社会化的持续深入、高校培养方式灵活多样化,学生公寓逐渐成为大学生生活、学习和思想交流的重要场所。如何运用学生公寓思想阵地构建高校
本文对2016至2018年三年来发表在国内主要新闻传播学期刊上的以人工智能背景下的中国传统媒体转型为主题的论文进行梳理后发现,学术界对该主题的研究主要集中在以下几个方向: