复杂背景下的文本提取技术

被引量 : 0次 | 上传用户:sunyanzi168168168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
OCR(Optical Character Recognition,光学文本识别)技术作为基本的模式识别技术,在计算机输入系统、智能交通系统和安防系统等领域都获得了广泛的应用。根据应用领域的不同,可分为通用的OCR技术及复杂背景下的OCR技术两大类,前者主要应用于将文字材料自动识别录入到计算机系统中;后者则应用于复杂的工业环境中,如智能交通系统中的汽车牌照识别、集装箱编号识别、火车车皮编码识别等领域。复杂背景下的OCR技术涉及的图象处理与模式识别技术较通用的OCR技术更为复杂,是文本识别技术的研究前沿之一。 本文在结合LPR(License Plate Recognition,车牌识别)技术进行实验的基础上,对复杂背景下的文本提取技术进行了研究,提出了基于PCNN(Pulse-CoupledNeural Networks,脉冲耦合神经网络)的边缘检测新方法;同时提出了基于形态学运算的断裂噪声过滤技术,有效实现文本字符特征的提取。 PCNN由Eckhorn根据猫大脑皮层中的视觉神经元同步脉冲(Synchronous Burst)现象所提出。由于具有一系列良好的特性,PCNN在图象处理、模式识别等领域获得了广泛的应用。本文提出的基于PCNN的边缘检测方法可直接对复杂环境下所采集的灰度图象进行边缘提取,并在此基础上实现对目标文本定位。 而在对包含目标文本的图象进行灰度拉伸和阈值分割等预处理以获得有有效的字符特征时,经常会造成目标文本的笔画发生断裂,采用常规的形态学开运算与闭运算对图象进行处理则会产生更严重的笔画断裂甚至缺失。本文利用形态学闭运算的变形对含目标文本的图象进行增强处理,可有效消除文本的断裂噪声。 实验结果表明,采用本文提出的技术方法可以有效检测复杂背景下的文本边缘和消除断裂噪声,增强目标文本的字符特征。
其他文献
本文从物质能量流分析的角度来研究生态城市设计过程,通过物质空间以及土地使用的设计,来影响和调节物质与能量流的生产、运输、分配,消费的过程;文章运用"生命周期评价LCA"
O2O模式正成为一种潮流,将这种模式运用到城市轨道交通地下空间商业开发中能促进轨道交通地下空间商业的发展。本文首先分析了O2O商业模式,介绍其起源、概念及类型;然后分析
当今世界正处在信息时代,信息产业已经成为我国国民经济新的增长点。随着信息产业的迅猛发展,IT员工,作为信息技术和信息产业的承载者,其职业压力问题日益凸现。本研究对IT员工的
<正> 1957年,毛泽东同志视察南方,路过信阳时,专门询问了期思孙叔敖的古迹,并高度评价了孙叔敖的治水业绩,称他是我国水利专家。孙叔敖,期思(今河南淮滨东南)人。他的父亲,原
教育惩罚作为一种教育手段,是人们长期而又广泛讨论的一个话题。惩罚作为一个教育学的问题,人们对它的看法并不一致,所以有对其进行探讨的必要。本文从教育学的视野考察了惩罚的
<正>1系统的组成及工艺流程我公司散装水泥气力输送上船系统由水泥出库设备、水泥计量设备、DB仓式气力输送泵、水泥输送管道及码头上船设备等五部分组成。而水泥计量设备
<正>水泥样品管理是水泥企业化验室管理的一项重要工作,要求设置专门放置样品的样品室,并对样品实行专人管理,建立样品台账等,但在样品处置方面尚有欠缺:不能按照样品封存期
<正>直通式水位自记井由井筒、水平进水管、沉砂池和井房组成,其中水平进水管是水位自记井重要组成部分。然而,在水位自记井工程建设中人们比较重视井筒部分的施工质量,而忽
交通警察的执法活动应当依法受到保护,执法行为神圣不可侵犯。本文分析了妨碍交通警察执法行为发生的主要原因,包括社会发展的客观原因——法律法规的不健全、驾驶人思想观念
金融国际化浪潮席卷全球,但我国目前金融市场的发展水平决定了监管部门必须对资本流动实行管制并持续一段时间。在这种情况下,离岸金融市场的起步可能是近期我国金融市场走向国