复杂彩色图像中文本定位方法的研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:nicico
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基于内容检索技术的发展,人们逐渐意识到包含在彩色图像中的文本具有重要的作用。自动识别这些文本,对高层语义的检索和索引具有重要意义。近年来,光学字符识别(Optical Character Recognition,OCR)技术已经取得广泛应用,可以将大量手写、印刷文档转为数字文档,但传统的OCR技术只能识别分辨率较高,背景简单的文档图像,而一般图像往往带有非文字的复杂背景区域,OCR很难通过版面分析的方法准确找到文本的位置,因此,给识别带来了极大的难度。如果能够采用有效可行的算法准确找到文本的位置,再将文本送与系统识别,就可以将光学字符识别技术的实用性和准确性大大提高,极大地扩展该技术的应用领域。   所谓文本定位,就是从复杂图像中找出文本所在的位置或刚好包围文本的矩形区域,这是文本识别非常关键的一步。文本定位的精确与否,直接决定了整个字符识别系统准确率的高低。如何从含有复杂背景的图像中快速而准确地进行文本定位,具有极其重要的理论和实践价值,已经成为图像处理领域一个热门课题。   本文对彩色图像的预处理过程进行了阐述,对现有的文本定位算法进行了归纳和总结,详细分析了各种算法的优劣。针对复杂彩色图像中文本信息的特点,本文提出了两种从备选图像块中筛选文本块的方法:一种是级联弱分类器法,该方法综合利用了文本块的形状特征、颜色特征、区域特征、字符笔画特征作为筛选的依据;另一种算法则综合利用了小波变换和人工神经网络进行判别。实验结果表明,这两种方法耗时短,准确率高,均可以得到较好的文本定位效果,对文本定位的研究具有一定的借鉴意义。
其他文献
在微波源固态化的过程中,以半导体材料为基础的大功率微波源技术迅猛发展。这种源有三个重要特点:1)输出窄脉冲信号。2)输出信号频带宽。3)输出瞬态峰值功率大。基于这些特点
本文对数学教学进行探究分析,阐述了在数学教学中如何培养学生数学思想,并提出相关优化数学教学的策略.
当光束在光折变晶体中传播时,由于扩散产生的偏折能被全内反射所平衡,此时能在光折变晶体的表面产生自感应的光折变表面波。光折变表面波是一种以自聚焦或自偏折为激发手段的自
在英国,有89%的英国人每周会收听一次广播节目,英国人每周收听广播总时长为21.3小时。过去十年来,统计结果一直稳定维持在这一水平。启示1:认真对待青年听众虽然英国人收听广
在小学英语教学中,激发学生的学习兴趣是非常重要的,可以让学生整个身心都充满快乐,为学生营造轻松、愉悦的学习环境,使他们在身心放松的情况下,达到最佳的学习状态.本文对小
今年3月,日本遭遇9级强震、海啸及核危机等次生灾害,股市遭受恐慌性抛售,导致绝大多数投资日本的基金损失惨重。而一只根据数学模型进行交易、用机器人作为基金经理的基金却
超导体的发展史就是一条不断探索新型超导体以及研究其超导机理的过程。本文主要基于近来处于超导领域研究热点的碳基超导体和新型的镍基超导体为研究对象,探索可能的新型超导
近些年来,随着我国新课改教育政策改革的不断推进,中小学校的教师在课堂教学过程中已经基本由过去传统的“填鸭式”、 “一言堂”、 “满堂灌”等单一、陈旧、刻板的教学模式
微波背景各向异性探测和Ia型超新星数据分析表明,宇宙在早期曾经有一个短暂的加速膨胀阶段,目前宇宙又一次进入了新的加速膨胀阶段。为了从理论上解释宇宙加速膨胀,人们构建了各
本文针对当前小学教学现状和教学特点等,对小学英语探究型课堂教学模式进行详细分析和阐述,希望为推动祖国教育事业发展提供相应合理化建议.