论文部分内容阅读
图像着色是给灰度图像添加色彩的过程,需要计算机辅助完成。图像彩色化也可以看成图像恢复。目前为止在医疗、考古、工业研究等领域有广泛应用。比如在对珍贵老照片、特殊成像机制等情况下留下的黑白图像的处理上,彩色图像由于其细节更突出、视觉效果更好,因而具有很大的研究价值。随着科技发展,对数字图像及影视的画质及多样性需求日益增加,数据量也逐渐增大,例如一幅1024*512大小的真彩色图片,所占空间已经达到12M字节,视频更是高达几百兆的传输量,因此对网络容量也要求越来越高,由此造成巨大的传输压力也是需要重视的问题。若从图像入手,对其进行合理压缩处理,降低所占空间,再在网路上传输就会很大程度上缓解网络压力。因此好的图像压缩算法的研究很有必要。基于上述背景,本文对图像压缩和着色中的彩色像素点的预测问题进行研究。在基于机器学习的背景下,图像压缩和图像彩色化都可以看成是颜色点的预测问题。正是由于机器学习算法的特殊性,图像压缩可以在前期压缩图像时只存储灰度版本图像和一些代表像素点;后期解压缩时使用存储的信息来学习模型给灰度图像着色,所以图像彩色化和压缩两者是相辅相成的。本文算法主要核心是机器学习中的拉普拉斯正则化最小二乘法(Laplacian Regularized Least Squares,LapRLS),在基于监督学习框架下结合其他假设(流形假设)和图片内部结构及特征,提出了基于监督学习的预测函数的方法。最后在计算复杂度的问题上使用基于核的非线性映射方法将原始数据点映射到低维的特征空间上,降低计算复杂度。本文的研究工作和创新点如下:(1)建立基于监督学习的LapRLS图像着色预测模型。首先建立基于训练点的损失函数,使用全部标记点。为了体现数据内部的分布结构以及保证最后结果的稳定性,再在损失函数上加入两项正则项加以约束。为了体现出图像像素点之间的相关性,本文采用流形假设方法,在基于此假设的前提下,构建出像素点间相似性图--K近邻(K-Nearest Neighbour,KNN)图,权重表示相似程度。加入约束稳定性的正则项是为了保证解收敛而不发散,在高斯核的基础上约束预测函数的范数。在此模型的基础上求出最优解。(2)在彩色化计算复杂度的问题上再次优化模型。使用机器学习中的核方法即核主成分分析(Kernel Principal Component Analysis,KPCA)把计算复杂度控制在适当范围。在原始数据点的基础上采用非线性映射,将原始数据点映射为特征空间中的一个点,由此达到的效果相当于降维。把基于核的方法加入到优化模型中,重新计算系数向量和最优解。由此来提高着色效率。(3)使用基于监督学习的LapRLS算法建立图像压缩方向的颜色点预测优化模型。本文研究的是有损图像的压缩,优化模型也即着色中建立的。但是值得注意的是,本文没有采用前人自主学习或其他启发式学习的方法来选点,因此也避免了由此带来的耗时问题。本文采用均匀采样的方式来给模型提供训练点,训练模型得出最优解。(4)图像压缩中为了提高解压缩阶段的图片颜色质量,本文采用具有差值图片的函数来优化模型。通过计算原来的图片和模型输出图片之间的差异来存储差值图片,提升解压缩阶段恢复的图片质量。