基于分块的光照失真文本图像校正的研究与应用

被引量 : 3次 | 上传用户:yueyingz4l
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术和现代工业的飞速发展,智能手机、平板电脑等移动设备的快速普及,使得通过拍照获取图像十分常见。利用计算机、互联网等信息处理技术来存放和处理图片与文字已成为主流。OCR技术是提取图片中文字信息最为高效的方法之一,有着广泛的应用。然而,在拍照过程中会由于各种主客观因素,如光照情况不佳、所拍摄纸张的质量不好等,可能会导致获取到的图像中出现噪声、阴影、局部强光等现象。这些干扰会导致图像质量降低,直接影响OCR识别效果。目前OCR技术的不足主要表现为对低质量图像的适应能力不足,无法提取出完整和正确的文字信息。为解决这一问题,本文首先介绍了图像处理领域的一些基本理论,然后阐述和分析了光照失真文本图像的特征、图像处理领域的常用技术手段和国内外现有的一些应用较为广泛的校正方法。在充分研究了光照失真文本图像区域亮度特征的基础上,针对该类图像提出了基于分块的校正方法。文章首先介绍了国内外有关本研究课题的研究现状和发展趋势,然后阐述了图像处理领域常用的图像特征提取、图像增强、二值化、去噪等关键技术的基本理论和流行算法。在分析了文本图像常见光照失真的表现形式的基础上,研究了光照失真对图像特征造成的影响。第四部分具体描述了本文校正方法的研究过程与设计实现:将图像分块并根据各块区域亮度特征区分出光照失真块和非失真块。对于光照非失真块采用区域OTSU算法进行二值化以节省处理时间,对于光照失真块则先进行图像增强,然后对增强后的图像块再次根据其区域亮度,判断采用区域OTSU算法或者本文改进的White算法进行二值化。校正方法的最后一步是对输出的二值图像进行去噪,以获取更好的OCR识别效果。实验结果表明,本文提出的解决方案对光照失真文本图像能够取得令人满意的校正效果,在OCR识别率和校正耗时方面比现有的校正方法均有优势,而且具有较强的鲁棒性。
其他文献
中国是全球最大的柑橘种植国和生产国。当前柑橘加工产品主要以柑橘罐头和柑橘汁为主,加工过程中产生的皮渣占果实总重量的40%-50%。柑橘皮渣中富含可溶性糖、酸、果胶、粗脂
痹证是临床常见病、多发病,早在《黄帝内经》中已有论述,所谓“风寒湿三气杂至,合而为痹也”。从西医学的角度来看,痹证涵盖西医众多疾病,1983年美国风湿病协会确认的10大类,
目的以老中医朱建贵教授诊治失眠验案为基础,结合数据挖掘技术,归纳、总结朱老诊疗失眠病的辨证规律、组方用药特点,以期继承和发扬中医药在失眠治疗的优势。方法收集朱建贵
目的:运用数据挖掘技术,同时根据“人机结合,以人为主”的研究方法,结合与安效先教授的访谈学习,整理总结安老师诊治儿童咳嗽变异性哮喘的临床经验及其学术思想。方法:本课题研
<正>超精密飞刀铣削是一种高精度多轴联动铣削技术,广泛应用于加工具有亚微米级尺寸精度和纳米级表面粗糙度的非旋转对称微纳结构表面。然而,加工过程中出现的刀具磨损将导致
互联网的出现,打破了原有的传播模式,催生出了一些新的传播平台,而微博传播平台的出现,使传播方式出现了更加前所未有的改变,微博以崭新的面貌使信息更加快捷、方便、迅速地
目的探讨经胆道镜等离子体冲击波碎石术(PSWL)应用效果及操作技巧。方法我院2004~2009年期间经胆道镜行PSWL破碎巨大残留结石56枚(54例),其中残留结石直径≤10mm 9枚,10mm<直
粮食安全问题是关系国民经济发展、社会稳定和国家自立的重大战略问题,农业环境问题则是中国农业是否能够实现可持续发展的关键。未来十年,中国高集约化的农业土地利用方式既
19世纪末、20世纪初,西方各领域对人的主观时间、心理时间开始深入挖掘,时间问题成为该历史时期思想形态的重要组成部分。哲学、艺术对于人的生存时间性表现出强烈关注和思考
随着时代发展,不同国家与文化间的交往与联系更加频繁与紧密,这对外语教学中的跨文化能力培养提出了更高要求。德语移民文学是由有移民背景的作家用德语创作的文学作品,这些