级联中文组块识别

来源 :北京邮电大学学报 | 被引量 : 28次 | 上传用户：chenhy8208

【摘要】

：

基于统计方法的中文组块研究大多借鉴CoNLL2000英文组块的思想,建立了组块表示的BIO模型,并将组块识别任务作为一种为词序列标注的多分类问题.为降低分类复杂度,采取了一种分解识别法,即先识别组块的边界,再进行组块类别判定.基于条件随机场(CRF)构建了级联组块识别器,实验数据集采用宾州大学中文树库(CTB5.1).在特征选择上,借鉴了中文分词特征选择的方法.5倍交叉验证的实验结果为:组块边界识

【作者】

：

秦颖王小捷钟义信

【机构】

：

北京邮电大学信息工程学院

【出处】

：

北京邮电大学学报

【发表日期】

：

2008年01期

【关键词】

：

中文组块边界识别类别识别条件随机场 Chinese chunking boundary identification type identificat

【基金项目】

：

语言司民文语科库工具建设项目（MZ115-022）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

店中店台北BARCODE＋the DEN

本案的基地呈＂L＂形,在空间上有诸多限制,也为设计师制造了不少难题。为了变不利为有利,设计师将原本不规则的基地分割成四个不同的功能区域,包括BARCODE、撞球室、the DEN和露

期刊

台北功能区域设计师空间广场露台剧场

级联中文组块识别

其他学术论文