论文部分内容阅读
OCR(Optical Character Recognition,光学文本识别)技术作为基本的模式识别技术,在计算机输入系统、智能交通系统和安防系统等领域都获得了广泛的应用。根据应用领域的不同,可分为通用的OCR技术及复杂背景下的OCR技术两大类,前者主要应用于将文字材料自动识别录入到计算机系统中;后者则应用于复杂的工业环境中,如智能交通系统中的汽车牌照识别、集装箱编号识别、火车车皮编码识别等领域。复杂背景下的OCR技术涉及的图象处理与模式识别技术较通用的OCR技术更为复杂,是文本识别技术的研究前沿之一。 本文在结合LPR(License Plate Recognition,车牌识别)技术进行实验的基础上,对复杂背景下的文本提取技术进行了研究,提出了基于PCNN(Pulse-CoupledNeural Networks,脉冲耦合神经网络)的边缘检测新方法;同时提出了基于形态学运算的断裂噪声过滤技术,有效实现文本字符特征的提取。 PCNN由Eckhorn根据猫大脑皮层中的视觉神经元同步脉冲(Synchronous Burst)现象所提出。由于具有一系列良好的特性,PCNN在图象处理、模式识别等领域获得了广泛的应用。本文提出的基于PCNN的边缘检测方法可直接对复杂环境下所采集的灰度图象进行边缘提取,并在此基础上实现对目标文本定位。 而在对包含目标文本的图象进行灰度拉伸和阈值分割等预处理以获得有有效的字符特征时,经常会造成目标文本的笔画发生断裂,采用常规的形态学开运算与闭运算对图象进行处理则会产生更严重的笔画断裂甚至缺失。本文利用形态学闭运算的变形对含目标文本的图象进行增强处理,可有效消除文本的断裂噪声。 实验结果表明,采用本文提出的技术方法可以有效检测复杂背景下的文本边缘和消除断裂噪声,增强目标文本的字符特征。