论文部分内容阅读
大部分传统的基于距离尺度学习的图像标注方法假设训练样本之间存在确定的约束关系。这样的假设在小规模、精准的数据集上可以取得一定的效果。但是当数据量较大,每幅图像有多个标注且部分标注含有噪声时,这种过于理想的假设则不成立。提出了一种基于概率主题模型的距离尺度学习方法,通过概率主题模型挖掘这种模糊的、潜在的不确定辅助信息,并应用于后续的距离尺度学习中得到语义上距离尺度,改进基于搜索的图像标注性能。在Flickr数据集上的实验证明所提出方法比当前方法具有更好的图像自动标注性能。