论文部分内容阅读
颜色恒常性作为人类视觉系统最基本、最重要的功能之一,是人类能稳定精确地感知世界的重要保障。具体地讲,当照射物体表面的入射光照颜色发生变化时,人类对该物体颜色的知觉仍然保持不变,这种知觉特性被称为颜色恒常性。颜色恒常性课题的目的是使计算机视觉系统获得相似的功能,成了计算机视觉领域中一个重要的研究课题。颜色恒常性计算的关键步骤是对图像光照的估计。常见的颜色恒常性算法可以分为有监督颜色恒常性算法和无监督颜色恒常性算法两种。其中有监督算法有着较好的效果,却需要大量的有标记数据作为支持来训练,而在现实应用中,这种有标记数据集往往是难以获得的,这也就导致了有监督算法由于数据不足的问题在实际问题中难以应用。与难以获得的有标记数据相反,大量的无标记数据通常可以较为容易地获得,却无法被常见的有监督算法和无监督算法加以利用。这些无标记数据可以反映数据的特征,对算法效果的提升有着重要的意义。本文即以颜色恒常性计算中常见的有标记数据量不足的问题作为研究对象,通过利用无标记数据,提出了两种基于半监督学习的颜色恒常性算法:基于分歧学习的半监督颜色恒常性算法和基于Safe Semi-supervised Support Vector Machine(S4VM)的半监督颜色恒常性算法。基于分歧的半监督颜色恒常性算法旨在通过多个分类器解决有标记数据不足的问题。基于分歧的半监督算法认为,一个数据集通常有多个视图可以描述其样本空间的特征,在假设这些视图互相充分、互相独立的前提下,可以通过多个视图互相学习来提高算法效果。首先,基于分歧的半监督学习在少量有标记样本下训练多个分类器,然后利用分类器之间侧重点不同的特性,对大量无标记样本赋予伪标记,并对该伪标记赋予一个置信度,表示该伪标记能够真实反映实际情况的可能性。然后每个学习器分别将无标记样本中最有自信的部分传递给其他分类器,以此逐渐增加训练集数量,进而快速有效地提升算法效果。基于S4VM的半监督颜色恒常性算法是本文提出的另一种半监督算法,用于解决有标记数据不足的问题。该算法主要分为两个步骤。首先,根据图像的威布尔分量等特征,数据集中的样本可以在特征空间上形成聚类。通过计算可以得到每个类别对应的最优颜色恒常性算法。然后,通过使用S4VM进行判断,测试数据被划分到合适的类别,使用该类别对应的最优算法进行光照估计。S4VM算法认为,给定一个数据集,可以在其特征空间中找到多条近似的最大间隔分类器,而其中任意一条都有可能是最优解。因此S4VM通过提升最大间隔分类器集合中最差的一条的效果,来达到整体效果稳定的提升。通过实验证明,本文提出的两种半监督颜色恒常性算法均可以获得良好的效果。其中基于分歧的半监督算法操作简单快速,可以使用较小的消耗获得一定程度的提升。基于S4VM的半监督算法则有着扎实的理论基础,逻辑清晰,在不同情况下有着相对更稳定、优秀的效果,但由于是一种融和算法,算法稍显复杂。在训练数据不足的情况下,两种半监督算法均可超越目前主流的有监督算法和无监督算法,取得良好的效果。