基于Linux平台的图片文字识别系统

来源 :吉林大学 | 被引量 : 0次 | 上传用户:dillydally
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图片文字识别OCR(Optical Character Recognition,光学字符识别)应用非常广泛。例如DNA序列图片识别;PDF文字识别;车牌号码自动识别;手机上的手写输入识别等。近年来该应用更加广泛,必然出现在教育领域的一款手机应用,将手机把试卷拍照查询答案,首先就是图片文字识别处理。相信越来越有魔力的应用会继续产生。而图片文字识别唯一重要的标准就是识别率。现在的图片文字识别没有100%的识别率,这也成为了图片文字识别应用发展的一大瓶颈,因此探索一个好的图片文字识别算法很有意义。图片文字识别涉及图片处理技术、模式识别技术、数据库存储等。本文图片文字识别基本流程一般是:获得图片、去噪处理、二值化处理、矫正图片、行查找、文字定位、细化处理、文字特征扫描、查询显示文字等处理过程。主要使用了linux下的opencv图像处理库,该库图像处理丰富,性能良好;文字的特征码存储在Mysql数据库中。图片识别计算量大,占用存储也比较多。因此性能和资源也是需要考虑的一个因素。文字识别结束后如果能根据上下文词汇进行二次校验将是提升准确率的一个好方法,由于本着着重研究识别算法的精确度,未包含该项步骤。在后续的工作中再考虑使用该方法进一步提升准确率。Opencv提供了图片处理的基本函数,例如图片存储,数据矩阵的遍历等,去噪处理中的平滑处理、二值化处理等。矫正图片就是将图片按照文字的行摆正,该步骤是比较关键的一步,后面的行定位等都依赖于图片矫正。文字的行定位和文字定位即确定文字区域,方便文字特征扫描,细化处理是将文字细化为一个像素,而又不破坏连通性。细化处理是方便特征扫描而做的处理。数据库中存储文字特征码和UTF8编码对应起来。图片文字识别中包含了标点符号识别、汉字识别、英文字母识别等。本着主要针对印刷体文字识别。该项识别应用占大多数。其中汉字识别比较复杂,本文采用了独特的连通域扫描识别笔画,并根据笔画的位置产生特征码。笔画就是一笔不间断的书写而成的。在笔画识别过程中本文使用了笔画直线化概念,认为所有笔画都可以简单的分为直线和曲线,将文字简化为直线和曲线以及交叉点组成可以即精准右简化了文字特征码的扫描。本文阐述了整个图片文字识别系统的工作过程,以及使用的技术和算法。针对opencv的使用和数据库的使用。每一个处理过程都是需要试验来验证的。通过展示变化图片可以清晰的了解处理过程。经过大量试验验证了其准确性和稳定性。该图片文字识别系统满足了当初的设计意图。
其他文献
高温制曲是提高酱香型白酒风格质量的基础。要制出优质的高温大曲,就必须把握好高温、多水、微氧或缺氧几个重要环节,才能生产出优质的高温大曲,提高酱香型酒的风格质量。
顶管施工由于开挖量小,快捷方便,而且具有较好的经济效益,得到了广泛的应用。顶管施工一般在工作井中进行,井体需要承受顶管向前顶进的所有水平顶力,因此,井体的整体受力性能
目的:观察活体碘油门静脉灌注在大鼠肝泡状棘球蚴病模型中的分布,初步探讨肝泡状棘球蚴病的门脉血供。方法:以10只健康Wistar大鼠作为正常对照组并随机分为3组,每组动物数分别为4
政府由控制型向服务型转变,公众对政府的需求是首要解决的问题,公众广泛参与是政府了解公众需求的主要方式,政府必须转变行政观念,转变工作作风和改进工作方式,通畅公众与政府互动
国家主席胡锦涛日前在亚太经合组织(APEC)工商领导人峰会上指出,预计"十二五"时期,中国环保产业将继续快速增长。2015年环保产业总产值有望超过2万亿元人民币。2011年至2015年,中国环保投资将达3.1万亿元人民币,较过去五年翻一番。政府将大力发展环保产业目前,我国正以环保服务业为龙头,大力发展环保产业。预计"十二五"期间,我国环保投资将超过3万亿元,环保产业仍将保持年均15%-20%的复合
探讨了汽车真空助力器压力滞后的定义及理论计算,提出平均压力滞后和平均压力滞后率的概念。并详细阐述真空助力器压力滞后的影响因素,通过试验验证减少真空助力器压力滞后水
《中日古代文学比较研究》的著者为山东大学外语学院副院长兼东语系系主任高文汉教授。该专著属中日比较文学的重大基础性研究,也是国家教委八·五规划项目。它的出版是中日比
根据曲面切削原理控制铣床刀具的运动,从而实现五轴数控模具铣床,通过运用数学的坐标转换,理论分析在五轴数控模具铣床上实现曲面切削加工.
在口头程式理论的影响下,惠特曼独辟蹊径,试图重新建立荷马史诗的文学艺术批评取向。他的荷马研究以历史环境和史诗文本为出发点,从史诗整体、文学技巧、英雄人物等多侧面思