自然场景中文字识别关键技术研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:sssss1O
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在一幅图像中,文字相对图像中其他内容来说含有更多的信息,如果能够从图像中正确识别这些文字,那么将对图像检索、图像分析和图像理解等工作起着重要的辅助作用,因此自然场景中的文字识别也越来越受到研究学者的关注。传统的字符识别(OCR光学字符识别)技术历经多年的发展已经相对成熟,但它只是针对背景单一、分辨率及对比度较高的扫描型文档进行识别,在对自然场景中的文字进行识别时并不能取得令人满意的效果,这是因为自然场景文本图像中存在不均匀的光照、运动模糊、污损以及背景复杂等问题,如何在识别过程中克服或弱化这些问题是我们研究的主要方向。本文重点研究与探讨了自然场景中文字识别中的特征提取和特征选择两项关键技术,主要内容如下:(1)本文在积分通道特征(Integral Channel Feature)和特征池(Feature Pooling)技术的基础上提出了一种针对自然场景条件下的文字识别方法。我们在已有的研究基础上,结合pooling策略对图像的特征表达方法进行了改进,同时对多种通道特征和相关参数进行了实验验证。实验结果表明,我们提出的方法对识别自然场景图像中的文字具有较强的适应能力,对旋转和光照不敏感,相对于其他方法具有结构简单和识别率高的优点。(2)本文提出了一种基于Relief F和MSVM-RFE的多类特征选择算法,用于解决自然场景文本图像因其背景复杂等原因导致图像特征中存在大量的不相关和冗余特征的问题。我们主要对特征评价函数进行了改进,使用Relief F和MSVM-RFE两种算法的权重对图像特征进行综合评价,并在迭代过程中不断增加MSVM-RFE算法的权重比例。实验中,我们与支持向量机训练权重方法、Relief F算法和MSVM-RFE算法进行了对比,结果表明,我们提出的综合特征评价方法对图像特征更具辨识能力,在去除冗余和不相关特征时获得了更好的效果。
其他文献
频繁项挖掘算法在网络监控领域具有广泛的应用。利用频繁项挖掘算法识别网络中的大流量,可以实时检测网络中的异常及拥塞情况、辅助服务商流量计费等。但是,随着骨干网络链路带
随着社会经济的发展,尤其是“智能交通”和“平安城市”等相关项目的相继实施,安防领域迎来了前所未有的发展机遇。虽然当前摄像头遍布大街小巷,各种视频数据泛滥,但是当需要调取
随着无纸化办公的普及,目前各级政府机关、学校、医院、企事业单位的许多机密信息都是存储在计算机中,这极大的方便了相关机构工作和业务的开展,提高了工作效率,节省了人力物力。
在21世纪的今天,日益成熟的网络已经成为了人们生活中不可或缺的重要组成部分,而随之而来的是信息安全问题。怎样保证重要信息在网络环境中的安全传输成为信息安全领域研究的一
目前,网络通信与人们的日常生产、生活联系日趋紧密,然而它在给人们带来便利的同时,通信的安全问题也凸显出来,这个问题的解决很大程度上需要有好的安全协议来对其进行保障。
针对循环进行优化一直是编译器优化方法中性能提升的主要来源之一,软件流水技术就是其中一个比较著名和成熟的循环指令调度技术。软件流水技术的主要思想是将多个连续的迭代持
Ad Hoc网络中节点可以快速自由移动,各节点之间地位平等,既是通信终端,又作为路由器进行数据接收和转发,使得Ad Hoc网络非常适合于灾区、战场等应急通信场景。因无需使用固定
随着智能手机等移动设备的普及,移动社交网络(Mobile Social Network, MSN)发展迅猛。面对层出不穷的移动社交服务,高效的内容分发和数据传输方式已成为研究热点。移动社交网
仿真平台不仅为不同指令集架构的应用程序重用提供了支持,也为嵌入式系统设计提供了更先进的方法。动态二进制翻译是一种用于实现仿真处理器的即时翻译(Just In Time)技术,是不
随着软件和网络的快速发展,数据库的应用越来越广泛,发挥的作用也越来越重要;数据库产品的功能完善程度和性能稳定程度直接影响着软件的发布质量,所以对数据库产品的测试也显得