论文部分内容阅读
以科技文献中的共现关键词一叙词词对(以下简称共现词对)为研究对象,运用互信息法、概率法计算方法,以准确率和召回率为衡量指标,通过绝对值方式和相对最高值方式,分析这两种统计方法在不同区间内对同义共现词对的自动识别效果及特点。研究发现,概率法的相对最高值方式具有最佳的同义共现词对识别效果。最后,探讨互信息法、概率法与共现频率的关系,揭示这两种统计方法在同义共现词对的识别上存在互补的特性。