面向人名消歧任务的人名识别系统

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:xuanguiqq110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
CLP2010(CIPS-SIGHAN Joint Conference on Chinese Language Processing)的人名消歧评测的任务是个聚类问题:对给定的一组文档,按照文档中出现的指定查询词所指向的人进行聚类。由于是用"字"串匹配的方法从新华社的语料库中抽出所有含有该查询词的文档。所以对于这个任务,首要问题是判定查询词是否是人名,是完整人名还是人名的一部分。为此该文实现了一个基于多实体识别系统整合和启发式规则的后处理方法的人名识别系统,从而实现对文档中的人名,特别是查询词所涉及的人名的识别。在CLP2010的评测方给的训练集上的实验表明,查询词涉及的人名的识别正确率达到98.89%。
其他文献
近年来,我国人口老龄化加剧,北京、天津等大城市更是提早步入老龄社会。由于大城市人口密集,环境喧嚣,生活等各方面成本都较高,不适合养老产业的长足发展。河北紧邻京津地区,
随着我国经济的快速发展,人们所需要的便利出行和环保节能的需求也日益增高。施工企业有着非常好的优势,一个项目的启动其施工的效益是非常可观的,但是由于近来年的市场竞争