论文部分内容阅读
近几年来,图像识别领域因为深度学习的迅猛发展有了很大的突破,其识别能力已经达到了语义层面,能够对图像进行高度概念化的分类。其中卷积神经网络的表现尤其优秀,是目前诸多研究的热点,也产生了许多成熟的应用。然而,其理论原理依然是模糊的,往往需要大量的样本训练,它在处理高度概念化的信息的同时,常常反而会对基础的图像识别表现不好。这三方面成了卷积神经网络(CNN)发展的重点解决对象。近年来,学者们提出了诸如可视化、数据增强、小波散射网络这类的解决方案。其中,小波散射网络(SCN)理论坚实,对数据样本的需求小,在诸多分类领域,如图像分类、音频识别上表现较好。考虑到其与卷积神经网络之间的结构的高度相似性,即卷积加非线性加平均的模式,小波散射网络也可以看做卷积神经网络的一类解释方案。小波散射网络(SCN)具有如此多的优点,那么就有进一步思考和探究的必要。本文探究散射网络结构的物理依据,卷积核在其中扮演的角色,在此基础上探讨一些本身具有优良性质的卷积核在散射网络中的适用性,最后,本文提出了以时频窗为卷积核的时频散射变换,作为小波散射变换的补充,并验证了其在理论上的有效性。具体内容如下:首先,探讨了小波散射变换的构造原理,得到其对卷积核组的具体要求条件,总结得到均匀覆盖性质,并验证时频窗作为卷积核能够完美符合该性质,并以此构建时频散射网络,提出时频散射变换。其次,考虑输入信息自身具有的频域带限性质以及实际使用时充作卷积核的时频窗滤波器组的数量的有限性,提出频域有限的时频散射网络。利用该网络与时频散射网络的关系验证其符合的性质,并将保范性拓展为上下有界性,为选取卷积核和网络层数提供依据。最后,以图像为分类识别对象,提出在二维情况下的旋转时频散射变换,为图像识别进一步提供旋转不变性。在此基础上,建立时频散射快速算法,结合主成分分析(PCA)对图像进行分类测试,将其与其他算法进行比较,显示其与小波散射变换不同的分类能力。