面向图像的场景文字识别技术研究

来源 :辽宁工业大学 | 被引量 : 11次 | 上传用户：xukaiboy123

【摘要】

：

随着互联网发展和图像录入设备的普及,图像在人们的生活中越来越受到关注。图像除了更加生动展示了事物,而且比单纯文字蕴含着更多的信息,从图像中获取文字信息优点就是,可以

【作者】

：

卢未来

【出处】

：

辽宁工业大学

【发表日期】

：

2018年01期

【关键词】

：

场景文字识别深度学习笔画宽度变换最大稳定极值区域场景图像

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网发展和图像录入设备的普及,图像在人们的生活中越来越受到关注。图像除了更加生动展示了事物,而且比单纯文字蕴含着更多的信息,从图像中获取文字信息优点就是,可以获取与图像相关联的文字信息,通过对文字信息进一步处理,如互联网检索,能够从这些文字信息当中获取更多的图像信息。但是如何从图像中获取文字信息,一直是令人困扰的话题。为了能够从各种复杂的图像中提取文字信息,各种文字识别理论相继提出,并从在实践中取得一定成果,近年来,场景文字识别技术得到计算机视觉社区研究人员青睐,并一直处于研究发展当中。本文基于已有的场景文字识别算法,对场景文字识别技术的理论与实践进行了系统深入的研究。在文字识别方法中,本文分析了传统文字识别技术和非传统文字识别理论方法,并介绍了2种流行文字识别算法,即基于MSER算法和基于SWT算法,提出了一种基于SWT改进算法;在文字提取方法中,本文分析了传统文字提取技术和非传统文字提取理论方法,并介绍了2种流行文字提取算法,即基于Otsu算法和基于分水岭算法,提出了一种基于Otsu改进算法;在深度学习文字识别方法中,本文分析了深度学习一般框架和流程,并介绍了时下流行CTPN场景文字识别算法,设计了一个基于CTPN+CRNN文字识别系统。本文通过实验仿真,在文字识别方法中,改进了基于SWT算法流程,使其加快识别速度,实验结果表明,改进的算法符合实际要求,速度提升了38%左右;在文字提取方法中,改进了基于Otsu算法流程,使其具有更好的识别效果,实验结果表明,改进的Otsu算法不仅逼原算法效率高,而且要比传统的全局Otsu算法分割效果要好;在深度学习文字识别方法中,本文设计了一个基于CTPN+CRNN的场景文字识别系统,其系统的查准率和查全率表现良好,对实际场景文字识别实践方法具有一定的借鉴意义。

其他文献

亏损上市公司利用八项计提进行盈余管理的实证分析

在具有盈余管理动机的上市公司中,亏损公司盈余管理动机最为强烈。文章采用抽样技术对2003—2005年度部分亏损公司资产减值的八项计提进行了分项检验,发现被主要用于盈余管理

期刊

上市公司资产减值盈余管理

经典延续绿魔来袭技嘉G1.Sniper B7评测

虽然Z170最先问世，但是毫无疑问B150才是市场的主流，跑量的大户。在Z170发布一个月之后，Intel解锁了H170和B150芯片组和对应的不可调节倍频的非K系列第六代酷睿处理器。各个厂商也顺势推出了基于这两款芯片组的主板产品。《电脑迷》评测室收到了来自技嘉的G1.Sniper B7主板，该主板基于Intel B150芯片组，用于取代之前基于B85芯片组的G1.Sniper B6。该主板的表现

期刊

技嘉评测150芯片组Intel主板处理器可调节倍频

论战略管理会计的思想

战略管理会计是市场经济的产物，是在企业生存环境日益不确定的背景下形成和发展起来的。战略管理会计的思想渗透到整个管理会计信息系统，能使企业获得持久的战略竞争力。

期刊

满足客户适应环境整体观念以人为本可持续发展satisfying customer adapt circumstances entire idea

网络防御问题的思考

<正>近年的互联网络攻击速度远远超过了网络防御技术发展,各种类型的僵尸网络攻击给网络管理人员带来了更大的挑战.我国当前对关键基础设施的信息安全关注不够,造成重点行业

期刊

网络防御僵尸网络网络攻击网络安全系统防御恶意软件内控机制网络管理人员关键基础设施蓄意破坏

面向图像的场景文字识别技术研究

其他学术论文