论文部分内容阅读
在网络社区中由于标签的标注过程具有随意性和多样性,一个标签通常有几种含义,导致标签的准确率较低,因此在网络协作标注过程中标签的一词多义和同义是首先需要解决的问题。本文提出了一个基于上下文的标签消歧算法,大概方法是利用Wikipedia的通用信息来拓展标签的语义,然后提取图像的上下文信息并比较其与各个Wikipedia条目的相关程度。相似度最高的Wikipedia条目被选取来代表这个标签的真正含义。通过实验证明,此算法可以取得较高的准确性。