中文嵌套命名实体识别语料库的构建

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:yigeyongbao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
嵌套命名实体含有丰富的实体和实体间语义关系,有助于提高信息抽取的效率。由于缺少统一的标准中文嵌套命名实体语料库,目前中文嵌套命名实体的研究工作难于比较。该文在已有命名实体语料的基础上采用半自动化方法构建了两个中文嵌套命名实体语料库。首先利用已有中文命名实体语料库中的标注信息自动地构造出尽可能多的嵌套命名实体,然后再进行手工调整以满足对中文嵌套实体的标注要求,从而构建高质量的中文嵌套命名实体识别语料库。语料内和跨语料嵌套实体识别的初步实验表明,中文嵌套命名实体识别仍是一个比较困难的问题,需要进一步研究。
其他文献
它,诞生之初便受到瞩目;它,甫一问世便获得好评;它,瞄准了最具爆发力的市场空位;它,引爆了百亿级行业市场规模……它,就是极品金草,意味着无限的商机。极品金草原料选材濒危保护珍稀植
素质教育改革大力倡导均衡发展,其中音乐教育得到社会更多的重视。音乐教育是所有学生陶冶情操、滋润心灵的一副良药,它还有一个最重要的功能就是培育人的创造力和想象力。著