论文部分内容阅读
多媒体自动概念标注是在语义层次上进行视频浏览、搜索的关键技术。这方面的研究经历了两个阶段。第一个阶段使用二值分类算法检测概念集中的每个概念,并达到了一定得准确度。但是这种方法完全忽略了概念类别之间的关系。第二阶段的方法在单独检测单个概念的基础上添加了一个语义融合的步骤来通过挖掘概念之间的关联以此提高标注的准确度。但是这种方法会将第一步的分类错误引入第二步中造成“误差传播”的问题。为了解决上述问题,我们提出一种新的同时对单个概念与底层特征关系以及概念之间关系进行建模的方法,称作关联多类别方法(Correlative Multi-Label,简记CML)。我们在TRECVID数据集上与现有的算法进行了比较,并得到了满意的结果。另一方面,一般的主动学习算法可以在样本的维度上动态地构建训练集。尽管这种方法在一般的二值分类问题上取得了满意的结果,然而对于多类别问题而言不是最优的解决方法。我们认为,对于每个选出的样本,仅仅其中的一些有效类别需要被标注,而其它的类别可以通过类别之间的关系推断出来。这是因为考虑到类别的关联性,不同的类别对最小化分类误差的贡献是不同的。因此,我们提出一种通过选择样本-类别对来最小化多类别贝叶斯分类误差界的方法,我们称之为二维主动学习算法,因为它在设计主动学习策略时同时考虑了样本维度和类别维度。进一步,由于训练样本随着时间会不断增加,如果使用基于重训练策略的多类别分类器,会大大增加计算的强度。我们开发了一种高效的在线模型,它能够仅利用新到达的数据即可动态地更新当前的模型,大大提高了算法的效率。我们在两个标准数据集以及一个从Corbis网站上得到的真实数据集来测试上述的算法,并得到令人满意的结果。