基于深度学习的文本验证码反识别技术研究与原型实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:cecil666666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本验证码出现早,可扩展性强,被广泛使用。然而,随着深度学习技术的发展,文本验证码的安全性受到越来越大的挑战。因此,为增强文本验证码面对深度学习模型时的反识别能力,论文提出两类适用于不同场景的基于深度学习的文本验证码反识别算法,这两类算法能在不影响人眼识别成功率的前提下最大化提升原有文本验证码的反识别能力。第一,研究计算资源受限情况下如何尽可能提升文本验证码反识别能力的问题。深度神经网络对对抗样本十分敏感,通过向原始样本添加人类难以感知的微小扰动生成的对抗样本能够有效地愚弄神经网络模型,使模型输出截然不同的结果,这一点正好符合验证码设计的初衷。基于这点,本文提出四种不同应用场景下的对抗文本验证码扰动算法来增强文本验证码的反识别能力,该算法不需要收集大量的样本进行模型训练,通过对原始图片上的像素值进行小幅度有针对性的变化,就能有效地对深度神经模型进行干扰,适用于在计算资源受限情况下使用。第二,研究计算资源充足情况下如何最大化提升文本验证码反识别能力的问题。本论文提出一种风格迁移转换网络可以实时生成带任意风格的文本验证码图片。只需向训练好的网络中输入一张待增强的原始文本验证码图片和一张随机选取的风格图片就能很快生成一张任意的风格增强文本验证码。风格迁移技术能很好地对验证码的字符轮廓进行保留,通过不断改变风格图像,可以生成不同风格的文本验证码,大大增加了验证码的多样性与随机性,在不影响人眼识别成功率的前提下,极大增强了验证码的反识别能力。由于涉及模型训练以及需要大量训练样本,该方法适用于训练样本充足,计算机算力足够的情况下使用。第三,分析本论文提出的两类文本验证码反识别算法的性能表现。本论文使用4种常见的CNN模型作为反识别能力评价模型,通过计算识别成功率评估指标,检测在有图片预处理和无图片预处理情况下经过上述算法处理后的验证码图片的反识别能力,包括反识别能力评价模型对于算法处理前后验证码图片评估指标的变化情况,以及处理后验证码图片对于不同识别模型的干扰效果。除此之外,考虑到攻击者可能会重新收集文本验证码样本,对样本进行人工标记然后再训练模型,以提升模型识别准确率,本论文对该情况进行了模拟,对使用本论文提出的反识别算法生成的增强型文本验证码对于再训练攻击的抑制作用进行了研究。第四,研究本论文提出的两类文本验证码反识别算法生成的增强型文本验证码的可用性。本论文使用Amazon Mechanical Turk众包平台对原始文本验证码及增强型文本验证码的可用性进行了测试,观察人眼识别成功率及平均识别时间的变化情况,测试本文算法会在多大程度上影响原始文本验证码的可用性。第五,为了更直观方便地测试本论文提出的文本验证码反识别算法的反识别性能,本文设计实现了文本验证码反识别实验平台,该平台集成了本论文提出的两类反识别算法,用户可以在该平台上上传待强化的文本验证码图片,即可生成对应的增强型文本验证码图片,同时能观察到文本验证码被强化后,识别结果、置信度等各项指标的变化情况。实验结果表明,本论文提出的两类基于深度学习的文本验证码反识别算法都能在不影响人眼识别的前提下有效增强原有文本验证码对抗深度神经网络识别的能力。
其他文献
空间激光通信(Free Space Optical Communication,FSO)需要建立稳定的通信链路来保障通信质量,并且空间中环境复杂多变,因此对通信两端的端机对准程度和通信过程中的实时跟踪性能要求很高。针对这一需求,本文本将主要从激光光斑位置检测和跟踪控制技术两方面入手进行重点研究,来保证FSO的通信链路的稳定,主要工作内容如下:1、首先通过对光通信常用的3种光电探测器进行性能的分析对
1883年,英国科学家雷诺通过圆管实验,发现了流体有着两种不同的流动状态,分别为层流和湍流。从此,人类开启了对流体复杂流态特性的研究。随着对流体力学研究的不断深入,转捩与分离问题逐渐成为近百年来最重要的研究课题之一,也是导致航空飞行器设计不确定性主要来源之一。在日常生活中,转捩与分离现象十分普遍,但其存在的随机性与不确定性和缺失必要逻辑层面的准确定义致使该理论的发展目前尚不成熟。因此,在流体机械的
数值求解含流体双相介质和黏弹性介质中地震波传播方程,并进行波场模拟,对于油气勘探等具有十分重要的理论和实际意义。本文基于Birkhoffian系统,发展了求解双相介质和黏弹性介质中波传播方程的保辛方法。对于描述双相介质中弹性波传播的方程,首先构造了其相应的Birkhoffian系统,以及包含位移和速度梯度信息的广义Birkhoffian系统,然后在此基础上发展了求解弹性波方程的保辛方法(简称SSM
随着现代科学技术的发展,越来越多的科学与工程领域中的问题需要借助科学计算方法来求解。其中许多问题定义在无界区域上,而传统方法并不能有效地求解此类问题,人工边界方法是过去几十年发展起来的求解此类问题的重要方法之一。本文将人工边界方法应用到一类无界区域上的一维常系数电报方程初边值问题。我们首先引入适当的人工边界将问题限定在有限计算区域,随后利用Laplace变换以及一些基本的应用数学技巧,给出了该问题
当今经济全球化、区域间市场一体化的趋势依然没有改变,国际间投资和贸易的交流与合作依然是世界各国促进经济发展最有效的手段之一。中国始终坚持提升对外开放水平,构建良好营商环境,因此在吸引外商投资方面,就必须坚持包容开放的精神,推动投资自由化,促使外商投资能够在中国市场充分发挥其应有的作用,拉动经济持续增长,推动产业转型升级。建立和完善我国的外商投资国家安全审查是为引进外商投资设立底线,使得即能充分利用
胚胎干细胞有独特的能力,能自我更新,无限增殖,并分化或发育成多种类型的细胞和组织。胚胎干细胞应用到临床领域的关键问题是如何从其他类型的细胞中鉴定和分离出ES细胞。作为细胞的“身份证”,特异标志分子在胚胎干细胞识别和确定中发挥了重要作用。本论文中将从噬菌体肽库中筛选出的针对猕猴胚胎干细胞的特异多肽的DNA序列连接到pGEX-KG表达载体上,以便获得GST-peptides融合蛋白。同时,抽提大量培养
1906年1月,李叔同在日本编辑出版了综合性期刊《音乐小杂志》作为中国近代音乐期刊的起步,截至目前我国的音乐期刊发展道路已走过115年。1949年新中国的成立,使我国的社会制度发生了较大变革,文化思潮也随着社会环境的改变有了新的发展方向。上海作为当时国内现代化的城市,奥斯邦将中国第一座广播电台建立在上海并开始播音,这注定上海是近代中国广播事业最发达的城市。《广播歌选》作为曲谱类期刊,以广播为载体,
随着信息技术的发展和人们对生活便利性的追求,大量依靠生物特征构建的识别系统正在逐步取代传统的密钥验证,其中声纹具有特定性和相对稳定性的生物特征,在越来越多的认证系统中被使用。而随着语音合成技术的发展,使得人们可以利用计算机生成与自然人说话语音十分类似的合成语音,这一技术在提高自动语音应答服务质量的同时,也给基于声纹识别的说话人认证系统的安全性带来挑战。犯罪分子可以轻易的获取用户的个人语音信息,通过
在知识表示领域,数据稀疏性是大规模知识图谱普遍需要解决的难题。对此,研究者建立了一个连续的向量空间,将知识图谱三元组进行向量化嵌入到其中,从而实现了对实体和关系的分布式表示。现有模型在训练过程中采用生成负样本的方法主要是随机采样,通过此方法生成的大多数负样本质量较差,对于知识表示的健壮性增强并不明显。本文在现有的面向知识图谱的表示学习相关原理和技术的基础上,将现有知识表示模型结合到生成对抗网络中提
随着经济的发展,物流运输活动在社会经济活动中的作用也日益提升。企业采购,居民家庭的牛奶、报纸运输,邮递服务,城市垃圾的回收等生产、服务活动都将我们的生活和物流运输紧密联系在一起。另一方面,在现实生活中,物流运输活动常常会遇到各种不确定因素,例如天气变化、交通拥堵、不确定的需求和服务时间等等,均给物流运输管理带来了极大的挑战。本文以物流运输中的车辆路径问题为研究背景,考虑带有随机顾客需求的情况,建立