复杂背景图像的文本信息提取研究

被引量 : 0次 | 上传用户:woshishaoqiaolin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像中的文本包含大量有价值的信息,是智能控制系统和信息检测与检索系统的重要处理对象。手机及各种便捷式图像获取设备的普及使得越来越多的信息载体以图像或视频的形式存在,让计算机代替人来处理、识别和理解图像中所包含的文字信息有强烈的应用需求,然而计算机对图像文本信息的识别和理解能力与实际应用要求尚有不小的距离。图像中文本信息的有效提取一直受到研究者的关注,尤其是复杂背景中的文本信息提取技术依然是急需解决的技术难题。本文研究工作着眼于对手机和相机等便携设备拍摄的具有复杂背景的图像中检测和定位文本信息,通过分析复杂背景图像中文本的固有特性,研究了三种文本检测和定位算法,实现了一个文本信息提取与识别系统。本文的主要研究成果和贡献包括:(1)提出了一种基于纹理和统计特征的文本检测和定位方法。采用简化的均值偏移方法对图像进行平滑滤波,对图像进行去噪的同时能保留变化相对较强的细节信息:在边缘图像中根据文本的纹理特性构建像素的笔划特征,去除非文本像素;利用文本的统计特征,去除非文本区域块。实验表明,该算法具有较快的速度和较高的召回率,尤其对处于复杂背景或与背景粘连的文本比较有效。(2)提出了一种基于改进的视觉关注模型的文本检测和定位方法。对Itti视觉关注模型进行了改进,一是高斯金字塔的层数可以根据图像的大小自动调整;二是根据字符的特性选择强度特征图作为显著图,去掉可能弱化文本区域的归一化过程;三是为了突出显著图中的细节信息,获取显著图的时候对特征图进行上采样,得到与源图像尺寸相同的显著图。利用字符边缘点的方向分布呈对称性的特点对连通元做初步过滤后,采用显著图作为掩膜来验证候选文本区域的真伪。实验表明,该算法具有较好的检测性能,能够有效地检测出对比度较弱的文本区域。(3)提出了一种基于尺度空间的文本检测和定位的方法。改进了边缘检测的模板,将4个方向的Sobel算子模板中两个对角线方向的模板替换为对应方向的脊线算子模板,以改善文本和背景粘连的处理效果。利用尺度空间中拉普拉斯-高斯算子最大响应值的特性来滤除非文本块,该响应值在尺度上往往和字符的笔划宽度对应,并且分布在笔划的交界和末端,利用候选文本区域的笔划宽度作为启发条件,寻找尺度空间中是否有对应的较强响应点存在,结合这些点的分布情况滤除非文本区域。实验结果表明该算法具有较高的精确度。(4)实现了一个自然场景图像中的文本自动检测与识别系统。对于输入的自然场景图像首先利用文本检测和定位方法给出图像中的文本区域,然后对检测出的文本区域在二值化后进行尺度归一化处理,最后利用一个字符识别软件提取出文本区域中的文字信息。(5)对三种文本检测和定位方法的性能做了比较和分析,并实验表明每种方法各有优缺点,基于纹理和统计特征的文本检测和定位方法的整体性能指标虽然低于其余两种方法,但该方法对于复杂文本背景的图像比较有效;基于视觉关注模型的文本检测和定位方法的性能稍逊于基于尺度空间的文本检测和定位的方法,但该方法能够成功检测出对比度较弱的文本区域;基于尺度空间的文本检测和定位方法的整体性能指标最高,尤其是在精确度上具有优势,能够有效去除和文本类似的背景区域。
其他文献
近几年来国内油田原油的开采量放缓,为满足国内市场需求,国家不断加强原油进口,外贸原油的进口量出现强劲的增长势头。港口作为海运运输网络的重要物流节点和运输链中的枢纽,
视频运动目标检测与跟踪技术是随着数字视频技术的发展而产生的一个新的研究课题,其在国防安全、民用事业等多方面有着广泛的应用价值和极大的发展前景。本文主要工作如下:在
戴维·雷勃是美国当代著名的剧作家,因其“越战三部曲”——《帕夫洛·赫梅尔的基本训练》、《棍棒与骨头》和《飘带》——而享有美国最重要的“越战剧作家”之称。本论文试
近年来,国内安防监控产品市场的竞争异常惨烈,各大国际品牌,如霍尼韦尔,博世,派尔高,松下,索尼等在高端市场已经大有作为,在国内的渠道实力也非常雄厚;与此同时,国内知名的海康威视,大华
随着互联网技术的发展与深入应用,出现了越来越多像“新浪”“腾讯”“淘宝”等大型门户网站或电子商务网站。这些网站都存储有大量图片资源,且图片数量呈爆炸式的增长。鉴于
2010年10月,“药家鑫事件”事件充斥各大媒体,半年之后,药家鑫事件风波未平,一波又起,“郭美美微博炫富”事件又一次充斥人们眼球,在网上引起一轮又一轮的轩然大波……,而她们,有一个
我国山区面积大,约占国土面积的2/3。随着我国陆地交通的快速发展,在进行铁路、公路的建设时,需要修建较多的山岭隧道,其中长大隧道占相当大的比例,而许多长大隧道也不可避免
胰腺癌是一种恶性程度很高的肿瘤。虽然近年来诊断和治疗技术不断提高,但胰腺癌病人生存状况仍不容乐观,这与胰腺癌发病机制复杂,多种基因参与调控,缺少有效的治疗靶点等有关
在人所感知到的环境信息中,动态视觉信息是主要组成部分,这些动态视觉信息已成为计算机视觉的一个重要的研究方向。运动目标检测与跟踪是应用视觉和运动图像编码研究领域的一
辅导员是大学生思想政治教育工作的骨干力量,是大学生健康成长的指导者、引路人和知心朋友,肩负着加强对大学生进行思想政治教育,提高他们的思想政治觉悟,帮助和引导他们树立