论文部分内容阅读
目的解决从大规模文本中自动获取同义关系。方法将同义关系抽任务取看成一个二值分类问题,将其分为训练阶段和抽取阶段,共4个处理模块:预处理、特征生成、模型训练和分类。结果提出并建立了一种新的同义关系抽取模型,并给出了该模型的关键实现算法。结论提出的方法比基于模板方法的F1值高出了24.4%,大幅度提高了同义关系抽取结果的精度。同时提出的方法有效地改善了基于模板方法领域自适应性差的缺点,所定义的特征和特征的权重计算更适合于判定学习算法。