论文部分内容阅读
自然场景图像中文本的提取为当前一种具有重要研究价值的图像处理技术,图像中文本的提取有利于对图像分析和理解,并契合于当下热门的机器视觉应用在工农业、交通和安全等行业的发展。而这个研究仍然需要完善,主要由于场景和文本的多样性,使得自然场景图像中中文文本的提取依然为一项具有挑战性的研究任务。本文在近年来大量的文本检测和提取的研究方法的基础上,对自然场景图像中的中文文本提取技术进行了研究,提出了两种针对中文的文本提取算法。基于边缘增强的最大稳定极值区域(Maximally Stable Extremal Regions,MSER)的文本提取算法。首先通过边缘增强的MSER检测算法得到候选MSER,再使用长短轴、面积、空洞数目等约束条件高效地过滤明显的非MSER,对候选文本进行初步验证。由于图像中的中文文本往往会被分割成多个MSER,本文提出的中心聚合方法对MSER进行中文的聚合,使得候选区域成为单个候选的中文文本分量,再对这些分量进行分析运用机器学习选出正确的中文文本。基于迭代自组织数据分析聚类算法的文本提取算法。首先,使用改进的NiBlack算法从图像中初步的分割出前景,再以Lab空间颜色信息和笔画宽度信息为特征使用聚类算法对图像进行分割。之后提取连通分量并使用几何特征的约束对所得到的连通分量进行过滤。对于过滤后的连通分量进行中文聚合,使分散的笔画形成候选中文文本。为了进一步验证文本,根据文本集群存在的规则将候选文本连接成行,其中拒绝笔画特征和空间特征不满足约束的候选文本。通过分析文本行级特征,运用SVM进行分类,得到正确的文本行及对应的正确文本。最后,利用建立的针对中文文本的自然场景图像的数据集进行实验,其中图像包涵了真实环境下各种不同的场景和不同的条件。实验结果表明,本文提出的方法能有效的提取场景图像中的文本信息,并具有令人满意的准确率和召回率。