论文部分内容阅读
针对生物术语的缩写词识别问题,提出了一种基于逆序文本对齐的搜索算法,它实现简单,不需要大量训练数据。该算法在对Medstract标准语料库测试中,准确率和召回率分别为91%和93%;在对包含128篇全文文本的大测试集SBQTL测试中,准确率和召回率分别为96%和84%。在详细分析实验结果后,提出了将文本预处理以及语法规则等自然语言处理技术融入搜索算法作为未来工作的方向。