论文部分内容阅读
现今社会迅猛发展,人工智能的概念在生活中已经做到广为人知,基于深度学习的统计人工智能在工业界和学术上也开始大放光芒,以此同时,国家也开始大力的推进人工智能在人类生活、社会方面的发展。图像作为一种重要的社交媒介,其重要性可想而知,而图像的安全问题也因此显得越发的重要。图像内容的恶意篡改不仅会引起公众的恐慌,也会使得社会公信力下降,而作恶者也因此获利,因此图像的源相机识别在某种程度上是一种保护社会上的大众免受其害的一种技术。传统的基于PRNU的源相机模型检测算法,这种方法先提取PRNU模式,测试的时候使用相关的方式进行模式对比来进行识别。这种方法有着很大的局限性,易遭受图像内容的干扰,测试的所有图像大小必须一样且不能经过裁剪。不同的相机往往其拍摄的图像的分辨率并不一样,因此这对其应用限制太严重。基于深度学习的相机模型识别算法,往往先提取patches,然后对patches进行训练的方式来进行识别,这种方式只需要patches的大小一样即可,不需要图像本身的分辨率一样,因此得到广泛的应用。本文中提出的一种基于ResNet与多尺度特征融合的算法,在其中主要使用了设置对比实验的方式,针对数据的采集和处理方式来对网络进行有效性验证。首先对于数据采集,我们提出了一个准则函数,基于该准则函数,采用了两种patches提出方式,方式一即直接使用准则函数得分在前64的patches,方式二为根据准则函数得分排序后的列表进行均有抽样的方式提取64个patches;同时,还有一种方式三,其不用准则函数,直接进行随机抽样的方式。其次,对于数据处理的方式,采用了高斯高通滤波、LBP算子以及不进行处理三种方式进行对比。我们使用上述方式处理后得到的九种数据集,对我们的模型进行了训练和测试,并进行了对照实验,得出在使用同一种提取方式的情况下,使用LBP算子处理的数据集训练前两个epoch准确率上升最快,其次是高斯高通处理后的数据,最后是未经处理的数据,但是在之后的训练中,未经处理的数据训练出来的网络,收敛速度更快,其次是LBP,最后是高斯高通处理的数据训练的网络,可以看出预处理在训练初期有一定的效应,但是当固定使用一个滤波器核时,效果并不好,因为可以用于分类的低频特征部分被抑制,而LBP是得出一个旋转不变的特征,对本问题有一定的好处,但是对于深度学习强大的特征提取能力来说,用处也不算特别大。而对于同一种预处理方式,不同抽样方式则各有侧重。同时经分析发现,其中三种Sony相机的区分很难,但是在使用预处理的情况下会变得容易区分,可是会影响别的类别的分类效果。