图像中文本信息的检测与提取

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:jasn114
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  文字是人和人之间进行思想、感情交流的重要工具,也是人类社会获取知识、传播知识的一种重要载体。目前,随着各种摄像设备的快速发展,人们可以很方便地获得大量的文字图像,如何从这些文本图像中提取出其中的文字信息,具有重要的理论意义和非常广泛的应用。本文针对相机拍照得到的文本图像,研究了文本图像二值化、文本区域的检测、单字符的分割等问题。本文的主要工作如下:   1.提出了一种基于小波变换的快速二值化算法,其基本思想是:先对原始图像进行小波分解,然后,对于得到的低频图像利用传统的全局阈值法计算阈值,并利用得到的阈值对原图进行二值化处理。实现了基于Harr小波变换和Otsu算法、Harr小波变换和简单统计法以及Harr小波变换和简单迭代法的快速二值化算法,并和传统的全局阈值法进行了比较。实验结果表明,本文提出的二值化算法的效果和传统全局阈值法差别不大,但计算速度有明显提高。   2.提出了一种基于多孔小波变换的文本检测和二值化算法,首先,对图像进行多孔小波变换,并根据高频分量的大小对图像进行初步的二值化,然后,利用水平和垂直方向投影的方法检测文本区域,最后,对于原图在检测得到的文本区域中利用局部 Otsu算法对二值化的效果进行改进(文本区域外均设为背景色)。实验结果表明,采用这种方法对文本图像进行二值化,不论是视觉上还是文字的正确识别率上均比传统的各种二值化方法要好。   3.提出了基于多线程处理的局部阈值二值化算法。实现结果表明,在具有多核处理器的计算机上,这种方法可以明显地提高二值化的速度。   4.在VC2008环境下,利用OpenCV编程实现了本文提出的各种文本图像二值化算法、文本检测算法以及基于形态学的二值图像去噪算法,并实现了单字符的分割。
其他文献
在运筹学、科学管理、信息科学、系统科学、计算机科学以及工程等众多领域中存在着许多客观的或人为的不确定性,这些领域中的很多决策需要在不确定环境下做出。不确定规划是解
摘 要:近年来,石油化工的污水处理问题日趋严峻,废水的排放量在增加,处理废水的难度越来越大。为了缓解石油化工的水污染问题,实现石油工业的可持续发展,文本细致分析了石油化工的污水处理问题,总结了污水处理的先进技术。  关键词:石油化工;污水处理;技术  引言  石油化工是对原油和天然气进行加工获得石油化工产品的工业。石油化工的生产过程中需要大量的水,使用过的水会被许多化学物质污染,需要通过有效的处理
在当今社会,随着经济的快速发展,家庭喂养宠物已经成为一种流行趋势,然而与宠物有关的寄生原虫病随之而来.近年来人群感染弓形虫病的比率逐年上升,其潜在危害直接影响着人们的身
龙香芋为江苏省兴化市地方特色品种,为魁芋类变种,口感细腻,味香质糯,营养丰富,深受广大消费者喜爱,产品远销苏州、无锡、常州以及北京等地。兴化市龙香芋常年种植面积近5万
世界各国的经验表明,流程模拟、先进控制与过程优化技术是提高企业经济效益的主要技术手段之一。因此设计开发1个基于生产数据驱动的智能化实用数据处理、建模与优化集成的系
学位
非线性算子不动点理论学科是非线性泛函分析方向的一个重要分支,尤其是非线性算子方程解的迭代逼近问题已被学者们近年来视为非线性泛函分析领域重要及关键课题.长久以来,许多
寻求高效求解偏微分方程的方法对科学的发展起了很大的作用。例如在工程和航空航天科学、通信等许多领域具有相当重要性的计算电磁学,就是利用数学理论将其转化为求解麦克斯韦