论文部分内容阅读
基于文本的验证码广泛部署于各种需要身份验证的门户网站,是互联网安全机制中重要的一环。对文本验证码的安全性和可用性进行分析,有助于提高网站对抗恶意攻击的能力,保证用户的信息安全,维护安全的网络环境。本文围绕基于卷积神经网络对验证码字符进行识别的问题展开研究,着力于提高神经网络识别准确度,降低实现结构的复杂度。本文的工作一方面可以为文本验证码的设计和可用性提供建议,另一方面为使用卷积神经网络完成具有挑战性的场景文本识别提供了新的研究思路。本文的主要工作如下:首先,分析了影响验证码字符安全机制的因素,分析其反分割与反识别的效果。研究了图像识别领域的主流算法卷积神经网络,对其基本理论和实现结构进行分析。介绍了卷积神经网络的各个实现模块,包括卷积操作、池化采样、激活函数和正则化方法,重点对卷积层中的激活函数的适用范围和使用条件进行分析。对经典的卷积神经网络模型进行仿真,展示了CNN、ResNet和Xception网络对验证码字符的识别性能。其次,在卷积神经网络的基础上,结合自归一化神经网络中的缩放指数型线性单元,引进自归一化属性,提出一种自标准化卷积神经网络。该归一化效果可以保证多层级训练的鲁棒性,减小训练误差的方差,增强神经网络的鲁棒性,在避免梯度爆炸和梯度消失的同时,缓解了CNN在识别验证码字符时出现的“过拟合现象”,提高了网络的泛化能力。随后,提出一种变分自编码卷积神经网络。研究了变分自编码器模型,该网络是深度模型和概率模型的结合,能够发现输入数据的结构,保证对输入进行压缩表征的属性具有概率上的意义。自编码卷积神经网络能够学习到一种有意义并且可泛化的潜在空间的表征,减少了识别验证码过程所需的训练时间,同时它为卷积神经网络这种层层抽象提取特征并最终输出目标的模型,提供了概率理论上的可解释性。最后,基于胶囊神经网络理论,提出一种指数型挤压函数驱动的胶囊神经网络LECapsNet,进一步提高识别准确率。分析了胶囊神经网络的实现原理,通过使用向量输出代替原本神经元的标量输出,每一个胶囊保存着输入特征的空间关系和几何理解,并传递给高级胶囊,利用路由协议代替原有的池化采样,在保留位置信息的同时可以对空间信息进行解析,这有助于处理含有模糊、堆叠字符的验证码图片。本文通过改变胶囊对于特征向量的聚类方式,提出一种指数型挤压函数驱动的胶囊神经网络LECapsNet,该模型对腾讯验证码的识别准确率达到了95%,对CCT验证码也能达到90%以上的准确率。