论文部分内容阅读
数字图像的真实性被动取证技术就是在没有任何先验知识的情况下,通过一定技术手段来判断图像是否是由数码相机拍摄得到的自然图像,其任务包括对图像的来源,图像经历的处理过程,图像内容的真伪进行分析和取证。数字图像真实性取证技术可以为新闻、出版、司法以及社会媒体等领域的图像真实性检测提供技术支持,有效地反制和震慑各种恶意的篡改、伪造行为。从数字图像真实性取证的角度出发,本论文的研究内容主要涉及自然图像与真实感计算机生成图像的识别,图像压缩历史检测,以及基于图像压缩历史不一致性的图像篡改检测。取得的主要研究成果包括:1.自然图像与真实感计算机生成图像识别(1)在现有的基于图像小波系数统计特性的图像识别方法上,进一步研究图像的成像特征和视觉特征。将彩色图像在不同颜色通道分别采用4级小波分解,采用图像降噪方法,分离出图像中包含的噪声信息和细节信息,提取统计特征,最后采用支持向量机(SVM)分类器实现自然图像和真实感计算机生成图像识别。(2)基于图像边缘局部块几何结构统计特性的分析,构造了用于识别自然图像与真实感计算机生成图像的两种特征。将图像边缘的3×3局部块映射到一个七维球面上,再将七维球面划分为17,520个Voronoi胞元,从而将七维球面上数据点的分布问题转换为数据点落入相应Voronoi栅格中的概率问题,用包含17,520个bin的直方图来表示两个图像类的PMF模型。所构造的一种特征反映了两类图像在局部结构上的形态差异,构造的另一种特征反映了两类图像在JPEG压缩时局部结构变化的差异。分别采用两个特征,采用阈值的方法实现自然图像和真实感计算机生成图像识别。(3)基于图像3×3边缘块几何结构呈稀疏分布的特性,提出了一种基于边缘块视觉词汇的自然图像与真实感计算机生成图像识别算法。首先,我们提出一种新的基于特定的Voronoi胞元构造视觉词汇的方法。该方法避免了传统视觉词袋法中采用无监督学习算法导致的不确定性。基于所构造的视觉词汇,一幅图像被表示为一个||V||(视觉词汇的尺寸)维特征向量。采用SVM分类器对自然图像和真实感计算机生成图像分类。所提出的分类算法具有较好的分类效果和抗压缩能力。(4)基于tetrolet-covering直方图(Ho C特征),提出一种抗压缩的自然图像与真实感计算机生成图像识别方法。一个4×4图像块的tetrolet-covering最优解刻画了该图像块的几何结构特征。我们利用Tetrolet变换中搜索tetrolet-covering最优解的自适应算法,引入tetrolet-covering直方图分析图像局部几何结构的统计特性。由于Tetrolet变换的自适应算法能够抓住图像局部几何特征,且选择受图像压缩影响小的颜色表示(饱和度分量),所提出的基于Ho C特征的自然图像与真实感计算机生成图像的识别算法不仅具有较高的识别率和泛化能力,也具有很好的抗压缩能力,在面向海量图像库的自然图像与计算机图生成图像识别中具有较好的应用前景。2.图像JPEG压缩历史检测(1)研究空间域像素级的JPEG压缩量化误差效应,基于dq曲线检测图像压缩历史。对待测图像实施不同质量的重压缩操作,用每一次重压缩前后图像像素差值的平方和来估计压缩的量化误差,并归一化为dq值,在Y,Cb,Cr三个颜色通道计算dq曲线,通过检测dq曲线上的局部最小值,可以判断图像的压缩历史,包括经历了几次压缩,压缩顺序以及每一次压缩的质量因子。提出了基于dq曲线检测照片图像的原始相机内压缩的算法,可以通过检测一幅照片图像是否具有相机内压缩来确定其来源真实性。(2)研究空间域图像块级的JPEG压缩量化误差效应,基于tetrolet-covering变化率曲线检测图像压缩历史。该方法将不同颜色分量的图像从空间域转换到tetrolet-covering索引域,分别计算待检测图像在不同压缩质量下tetrolet-covering的变化率,基于tetroletcovering的变化率对JPEG压缩引起的图像局部几何结构进行量化,通过检测变化率曲线上的局部最小值给出图像的压缩历史信息。给出了一种基于tetrolet-covering变化率曲线的多次JPEG压缩历史检测算法。上述两种图像压缩历史检测方法都是在单幅图像上检测压缩历史,无需复杂的分类器设计和大量的训练样本,避免了机器学习方法的模型训练过程,具有简单、可靠、高效率的特点。同时,现有JPEG压缩检测方法大都只能检测一次和二次压缩,对照片图像的相机内压缩检测、多次压缩历史检测尤其是在多次压缩时按照压缩历史顺序估计压缩质量还鲜见报道。3.基于压缩历史不一致性的图像合成篡改检测本论文在基于tetrolet-covering的图像压缩历史检测的研究基础上,研究了基于压缩历史不一致性的图像合成篡改检测方法。通过引入tetrolet-covering变化图,可视化地显示重压缩前后待测图像的tetrolet-covering索引值的变化。根据随着压缩次数增多,压缩的量化效应变小的结论,多次压缩的篡改块与原始图像块在重压缩时表现出tetroletcovering索引值变化不一致性,从而检测出篡改块。该方法通过tetrolet-covering索引值的变化反映图像块局部结构变化,能够克服篡改时没有保持JPEG网格结构对齐问题,与已有基于像素的方法相比具有一定优势。