论文部分内容阅读
文档图像的倾斜检测是文档图像处理的重要环节,检测精度直接影响文档图像页面分析的效果及字符识别的正确率。同时,该项技术在智能化的文档图像浏览,智能复印机和智能扫描仪等领域中有着广泛的应用前景。
现有的文档图像倾斜检测算法主要在文字区域内提取倾斜特征,并且往往针对某种特定的语言文字设计算法。因而对于混合多种文字,版式结构,以及包含图表等非文本区域的复杂结构文档图像检测效果较差,缺乏鲁棒性。
本文在深入分析现有算法和复杂结构文档图像特点的基础上,提出了一种基于鲁棒边界段的文档图像倾斜角度检测算法(Robust BorderLine based skewdetection algorithm,简称RBL算法)。该算法首先从图像中的文本区域及非文本区域提取连通区域的边界段作为倾斜特征。然后通过对提取的边界段做PCA分析来度量边界段的线性程度,选择线性程度足够好的边界段进行迭代优化,得到鲁棒边界段及其对应的倾斜角度。最后通过计算所有鲁棒边界段倾斜角度的加权中值得到整幅图像的倾斜角度。通过大量对比实验表明,该算法具有速度快,精度高,适用范围广的特点。
论文的第一章论述倾斜检测在文档图像处理中的作用,并介绍本文的主要工作;第二章将对现有的算法进行全面的介绍和分析。RBL算法的详细步骤及实现方法在第三章给出。论文的第四章介绍如何RBL本文算法应用于印章图像的倾斜角度检测。实验结果及分析在第五章给出。最后对全文进行总结了并对未来的工作进行了展望。