基于特征融合的术语型引用对象自动识别方法研究

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:deng5384588
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]设计特征融合和伪标签降噪策略,探索科技论文术语型引用对象自动识别方法.[方法]将术语型引用对象识别转换为序列标注问题,在BiLSTM-CNN-CRF输入层融合术语型引用对象的语言学和启发式两大类特征,增强引用对象的特征表示,设计伪标签学习降噪机制,采用半监督学习方法探究不同特征组合对识别效果的影响.[结果]本方法在术语型引用对象识别任务中最优F1值达到0.6018,比BERT模型实验结果提升8%.[局限]实验数据仅涉及计算机领域,在其他领域的可移植性有待考证.[结论]基于特征融合的深度学习方法在术语型引用对象的识别中有较好性能,伪标签学习方法解决了引用对象标注数据不足的问题,两者结合有效地探索了术语型引用对象自动化识别方法.
其他文献
随着科技不断发展,振动信号采集和分析作为机械故障诊断的主要方法越来越受到重视。所以,开发一款能够实现数据采集、在线监测、数据分析故障判断的硬件设备十分重要。嵌入式
铁路双层集装箱运输的出现是集装箱运输史上的一次革命.自20世纪70年代末铁路双层集装箱运输在美国问世以来就受到运输业界的极大推崇,现在已经在美国、加拿大和澳大利亚广泛
期刊