论文部分内容阅读
名物化复合词的识别是汉语复合词识别中的难点。困难之处在于汉语动词和名词共现时既可以构成动词短语也可以构成名物化复合词。传统的汉语复合词识别往往只使用语料统计特征,效果往往不怎么理想。基于最大熵模型,在基准上下文特征的基础上,采用了词汇特征与Web特征对动词和名词共现时的名物化候选进行判定,取得了较好的实验结果。其中,Precision达到了86.31%,Recall达到了70.00%。