基于卷积神经网络的文本验证码自动识别

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:wangdalu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
验证码,是用以区分计算机和人类的全自动图灵测试,是防止计算机程序对网站进行尝试暴力破解密码、大量注册账号等恶意攻击行为的一道安全墙。破解验证码的过程中,分析发现其存在的安全漏洞,促进设计出更安全的验证码,以更好地保障网络的安全。目前使用最广泛的验证码是基于文本的验证码机制,即在一张图片中存在若干个字符,用户需要输入与图片中相同的字符才可以通过测试。为了增加破解的难度,一些网站会采用变形算法对字符进行扭曲变形,甚至添加噪线或复杂背景来增加计算机识别的难度,一些验证码机制会采用粘连的方式将字符间的距离减小以抵御被分割。因为文本验证码生成简单、方便且便于用户识别,许多主流网站会设计自己的文本验证码以抵御恶意的网络攻击。本文从一些主流网站中选择了5种文本验证码机制进行破解。它们的验证码风格各不相同。百度的验证码中,字符或分离或粘连,字符或空心或实心,有些字符还带有阴影噪线,字符的字体也比较多样;维基百科的验证码中,各个字符之间大部分是分离的,字符的变形效果则比较单一;微软的验证码中,若干字符被整体旋转,字符或实心或空心,且有的字符中间呈现断裂的效果;新浪微博的验证码字符皆为实心,但是扭曲粘连比较严重;苹果验证码的背景由多条噪线组成,字符为空心。以往的破解验证码的流程中,大部分采用的是预处理、分割和识别三个步骤,而在识别这个步骤中,一般采用的是机器学习的方法,而这样的方法对分割的要求较高,所以针对粘连的验证码,一般分割的较差,进而导致识别的效果较差。本文采用的也是这三个步骤,但在识别部分使用的是卷积神经网络,其抗噪能力较强,而且不需要像机器学习那样人为定义特征,识别效果较好。首先,对验证码图片进行预处理,分离前景和背景,并将图片二值化;再将粘连字符进行平均分割,对不粘连的字符使用颜色填充方法分隔开;针对微软和苹果的验证码,因为字符个数的不确定,会使用卷积神经网络对字符个数进行预测,再根据预测结果进行分割。完成分割之后,对分割好的每个字符小图片使用卷积神经网络进行识别,最后的验证码结果即为这些字符的结果序列。本文的方法成功破解了百度、维基百科、微软、新浪微博和苹果的验证码,分别达到63.9%、87.1%、63.9%、50.9%和54.4%的成功率。其中,在预测字符个数上,微软的成功率为87.8%,苹果的成功率为95.3%。破解的成功率皆高于50%,显示出卷积神经网络的性能较优,而本文使用的方法对于破解文本验证码来说是一大利器,同时,本文也对文本验证码的特征和识别技术进行了分析,并针对文本验证码提出了4点建议。
其他文献
总结了高山杜鹃的特征特性.从基质准备、繁殖、移栽上盆、后期管理、花期调控、肥水运筹、病虫害防治等方面介绍了其盆栽技术.以期为高山杜鹃的栽培提供相应的技术指导。
“历代针灸学成就多媒体展示系统”系北京市中医药科技发展基金科研项目。它以历史为主线,运用现代多媒体技术,通过文字、图片、视频及动画等多种方式,直观生动地展示针灸学
战略性新兴产业与传统产业的耦合发展,是新经济时代我国经济和社会可持续发展的基础,也是我国经济持续增长的源动力。论文分析了战略性新兴产业与传统产业耦合发展的必要性,
目的:探讨银杏叶提取物治疗小儿肾病综合征的临床疗效。方法:文章按照贯序法将74例肾病综合征患儿随机分为观察组和对照组,其中观察组肾病综合征患儿在给予常规激素和对症治疗
公安边防部队作为一支现役部队,担负着维护边境地区社会安全稳定,保护人民生命财产安全的职责使命,参加抢险救灾行动已成为公安边防部队随时可能担负的任务。本文结合公安边
金文伟,1969年出生,浙江省龙泉市人。1993年毕业于景德镇陶瓷学院美术系雕塑专业,获学士学位1996年研究生毕业,获文学硕士学位。现任景德镇陶瓷学院陶瓷美术学院教授、硕士研究生
语文课程作为语言学习和中国文化基础学习的重要组成部分,对于小学生正确语言结构的建立,尊重并学习中国传统文化具有重要意义,尤其是生活化的语文教学对于实现语言学习目的
一、激励理论的主要内容1.激励的内涵激励就是通过管理工作设定的一定条件,激发被管理者去实现工作目标的积极性、主动性和创新精神,达到预期管理效果。激励分为内激励和外激励
利用F-函数扩展法求解超介质中的超短脉冲传输方程,探讨了超介质中的反常自陡效应和特有的二阶非线性色散效应所导致的新的孤子现象和规律.结果表明,正折射区的二阶非线性色
目的研究新疆马鹿角提取物对体外培养成骨细胞株MC3T3-E1细胞增殖、分化和矿化的影响。方法以MC3T3-E1细胞作为药物筛选模型,用MTT法测定不同浓度的新疆马鹿角提取物促细胞增