论文部分内容阅读
随着计算机多媒体技术的迅速发展,光学字符识别技术作为计算机智能化的一个重要应用,近年来也得到了快速的发展。由于受到拍摄设备和拍摄环境的影响,采集到的图像在识别之前必须进行预处理,包括图像增强、图像分割、倾斜校正等,这对后期的处理起到至关重要的作用。本文首先讨论了图像分割和倾斜校正国内外相关算法,根据仿真结果分析这些算法存在的缺点,在此基础上重点研究了全局阈值分割的Otsu算法和局部阈值分割的Sauvola算法,分析了Otsu算法和Sauvola算法的不足之处并加以改进。针对Otsu算法对于目标和背景方差中一类方差较大时,Otsu算法阈值偏高,导致分割效果不佳的问题,提出了一种改进的Otsu算法。改进算法根据图像目标与背景所占比例的不同,利用目标占整个图像的比例,综合类内方差来改进Otsu算法中的阈值选取公式。实验结果表明,改进的Otsu算法有效的解决了Otsu算法背景方差较大时,由于阈值偏高导致分割效果不佳的问题。针对Sauvola算法计算量大的问题,提出了一种改进的Sauvola算法。改进算法在计算局部阈值时,利用像素邻域灰度均值与中心像素灰度值的差值来代替Sauvola算法中的像素邻域标准差,利用像素邻域灰度最大值与最小值的差值来代替Sauvola算法中的标准差系数。实验结果表明,改进Sauvola算法在分割效果较好的情况下,缩小了算法的运行时间,提高了分割的效率。针对Hough变换法和投影法检测图像倾斜角度耗时大的问题,提出一种基于最小二乘法计算模型的倾斜校正算法。本文算法根据图像边缘存在方向基线的特点,快速检测出方向基线的倾角,然后计算出页面的倾角,进而通过旋转变换对倾斜图像进行校正。实验结果表明,本文算法能够快速检测出图像的倾斜角度。最后在LabVIEW平台上,利用LabVIEW Vision视觉开发包来实现相关的算法以及本文改进后的算法,结合实验结果说明了本文改进算法的有效性。