论文部分内容阅读
知识获取一直以来是自然语言处理中的瓶颈,基于树库的统计句法分析也不例外.树库中潜在隐含的语言知识是非常丰富的,但它们并不是可以直接得到,往往需要特定的策略才能将它们融合到模型中.我们的汉语统计句法分析模型从3个方面融合潜在的丰富语言知识:1)重新标注树库中的非递归名词短语和非递归动词短语;2)设计新的中心词映射表;3)引进上下文配置框架以更具体地描述二元依存结构.由于融合了以上三种潜在语言知识,模型的F1值提高了2.37%,完全匹配正确率提高了5.36%.