论文部分内容阅读
针对目前缺少较大规模的高质量上下位关系数据集以支持充分的模型训练和评价的问题,提出了一个完整、系统的上下位关系标注规范,并在此规范基础上标注了一个包含15024个汉语词对的高质量上下位关系数据集.所有数据均采用独立双人标注和专家不一致审核,双人标注一致性达94.20%.并且基于该数据集,对前人提出的几种典型分类方法进行了对比和分析,其中融合多特征的依存路径表示模型的F1值达到91.95%.