论文部分内容阅读
[目的]设计特征融合和伪标签降噪策略,探索科技论文术语型引用对象自动识别方法.[方法]将术语型引用对象识别转换为序列标注问题,在BiLSTM-CNN-CRF输入层融合术语型引用对象的语言学和启发式两大类特征,增强引用对象的特征表示,设计伪标签学习降噪机制,采用半监督学习方法探究不同特征组合对识别效果的影响.[结果]本方法在术语型引用对象识别任务中最优F1值达到0.6018,比BERT模型实验结果提升8%.[局限]实验数据仅涉及计算机领域,在其他领域的可移植性有待考证.[结论]基于特征融合的深度学习方法在术语型引用对象的识别中有较好性能,伪标签学习方法解决了引用对象标注数据不足的问题,两者结合有效地探索了术语型引用对象自动化识别方法.