论文部分内容阅读
在光源一定的变化范围内,人类具有对场景中的物体表面颜色感知不变性的能力。这种能够把光源的影响去除,使得人类能感知到物体表面真实颜色的能力叫做颜色恒常性。颜色恒常性是人在长期进化中获得的本能。人类优秀的颜色恒常性能力,对于人类稳定地感知认识世界具有不可忽视的作用。在计算机视觉领域中,正确的颜色特征是很多计算机视觉任务的基础条件,但由于摄像机生成图像时容易受到场景光照的影响,同一物体在图像中反映的颜色会出现差异性,造成了颜色特征的不稳定,因此颜色恒常性是个很重要的研究领域。本文主要尝试利用机器学习技术解决图像在不同色温下的差异性,恢复颜色恒常性,并进行了以下几方面的研究。针对传统对角校正模型存在的缺陷,基于全矩阵校正的图集真实色彩还原算法是一种有效的颜色恒常性恢复算法。针对该算法,分析其中存在的问题以及缺点,提出了基于图像内容的图集真实色彩还原算法。算法首先将图像像素点颜色进行分类,统计各类颜色在图中出现的比例,进而对求解全矩阵的最优化公式进行加权。所提算法能一定程度地服了色彩还原算法计算过程中的不稳定性,并提高颜色校正准确性,但改进的算法仅适用于带有色卡的图集,使用范围受限。论文进一步实现了一种基于神经网络的颜色恒常性算法,虽然该算法可获得相当好的预测效果,但是网络缺乏可解释性。据此本文用可视化方法来得到网络所学习到的特征,并根据颜色恒常性神经网络的特点提出一种新的可视化方法。该方法对输入图像进行小跨度逐块扫描的方式得到,将得到的小块输入到神经网络中,前向传播后得到对应神经元的响应值,将所有得到的响应值根据位置排列,重构出响应矩阵并转成热力图,从而得到响应可视化视图。算法克服反卷积可视化方式在颜色恒常性网络中的缺点,能很好地得到网络中的特征在图像中的响应。利用可视化工具,分析并解释网络的运作方式,得到网络中的每个步骤的意义,以及图像中的内容对最终预测结果有何影响。