论文部分内容阅读
基于统计的领域术语抽取方法近年来得到了广泛的研究。然而领域术语抽取方法与领域相关,并且评价需要大量的人力资源,因此对这些方法进行比较存在着一定的困难。因此本文采用基于词典的客观评价方法与基于人工的主观评价方法,使用准确率、召回率、F1-度量多种评价指标,对多种流行的统计术语抽取方法进行了比较和分析。本文根据领域术语的强文本表示功能,提出了基于支持向量机(SVM)训练得到超平面权重的术语抽取方法:利用TFIDF作词语特征,根据SVM模型训练出来的词语的权值大小判断是否是术语。实验结果表明,每种术语抽取方法适合抽取不同类型的术语,本文提出的基于SVM的术语抽取方法能有效地抽取领域术语。