融合全局词语边界特征的中文命名实体识别方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：biluo2007

【摘要】

：

目前在中文命名实体识别的任务中经常采用有监督的字序列标注模型。我们在实际应用中发现,基于字序列标注模型的中文命名实体识别模型对于词语边界的识别错误是影响识别效果

【作者】

：

刘冰洋伍大勇刘欣然程学旗

【机构】

：

中国科学院计算技术研究所网络数据科学与工程研究中心,中国科学院大学,国家计算机网络应急技术处理协调中心

【出处】

：

中文信息学报

【发表日期】

：

2017年2期

【关键词】

：

命名实体识别字序列标注全局特征词语边界特征 named entity recognition sequence labeling global fea

【基金项目】

：

国家自然科学基金（61232010,61100083）, 国家973课题（2012CB316303）, 国家863课题（2012AA011003）, 国家科技支撑计划（2012BAH46B04）, 国家安全专项（2013A140）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目前在中文命名实体识别的任务中经常采用有监督的字序列标注模型。我们在实际应用中发现,基于字序列标注模型的中文命名实体识别模型对于词语边界的识别错误是影响识别效果的主要因素之一,边界错误平均占错误结果中的47.5%。该文通过在平均感知机模型中引入全局的词语边界特征,使得人名、地名、机构名识别的F值平均提升了0.04并降低了边界错误占错误结果的比例。

其他文献

高职院校高分子材料成型加工课程教学探讨

为推动高分子材料成型加工课程改革,针对高分子材料成型加工课程教学存在课程体系不够完善、教材选取不恰当、教学内容陈旧、教学方法和手段单调落后等诸多问题,结合高职院校

期刊

教学理念课程体系教材内容方法teaching theoriescurriculum systemtextbookscontentsmethod

ISO／IEC17025：2005《检测和校准实验室能力的通用要求》中存在的错误

本文就ISO／IEC 17025《检测和校准实验室能力的通用要求》中存在的错误，提出看法。ISO／IEC 17025：2005《检测和校准实验室能力的通用要求》对ISO／IEC 17025；1999进行了修改和补充，使

期刊

实验室ISO/IEC17025错误Laboratory ISO/IEC 17025 Mistake

融合全局词语边界特征的中文命名实体识别方法

其他学术论文