分布式策略与CRFs相结合识别汉语组块

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:zyf853
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出了一种基于CRFs的分布式策略及错误驱动的方法识别汉语组块。该方法首先将11种类型的汉语组块进行分组,结合CRFs构建不同的组块识别模型来识别组块;之后利用基于CRFs的错误驱动技术自动对分组组块进行二次识别;最后依据各分组F值大小顺序处理类型冲突。实验结果表明,基于CRFs的分布式策略及错误驱动方法识别汉语组块是有效的,系统开放式测试的精确率、召回率、F值分别达到94.90%、91.00%和92.91%,好于单独的CRFs方法、分布式策略方法及其他组合方法。
其他文献
词干和构形附加成分是蒙古语词的组成成分,在构形附加成分中包含着数、格、体、时等大量语法信息。利用这些语法信息有助于使用计算机对蒙古语进行有效处理。蒙古语词在结构
目的通过分析白沙县流动人口疟疾感染情况,为控制流动人口疟疾感染,减少疟疾发病和传播提供依据。方法收集全县各乡(镇)卫生院及农场医院门诊医生、防保人员和乡村医生卫生员对3
在5月份的专栏文章《中日两国面对同一“针眼”》一文中,我说中日两国需要相似的经济增长方式转变。日本虽然比中国早20年到达“针眼”,但至今没有穿越过去。中国东部沿海的个
目的探讨多肿瘤标志物蛋白芯片检测系统对肺癌诊断的临床应用价值。方法138例肺癌患者、73例良性肺病患者和196例健康体检者血清中分别以多肿瘤标志物蛋白芯片检测12种常见肿