论文部分内容阅读
随着数字图书馆的兴起、多媒体信息检索和Internet技术的发展,彩色图像文本提取受到越来越多的重视,并应用于Web搜索、复杂文档的自动处理和各种图像数据库的检索等信息管理方面。图像中所包含的文本信息具有很重要的意义,通常形成对相关图像内容的简练描述或说明。自动定位图像中的文本区域,并提取这些文本信息,通过对它们的识别和分析,对于图像理解、检索查询是很有帮助的。 对于彩色图像中的文本来说,其字符排列有序,字体颜色基本相同,最重要的是字符本身与背景之间存在着明显的边缘轮廓。因此在进行彩色图像的文本提取时,有效利用文本的上述特点是十分重要的。 本文在借鉴文献[11]的基础上,对其提出的彩色边缘检测算子进行了改进,给出了CEDO(Color Edge Detection Operator)算子。CEDO算子是一个全面作用在RGB颜色空间三个分量上的边缘检测算子。它首先将灰度图像边缘检测算子Roberts算子推广到彩色图像边缘检测中,采用欧氏距离将像素彩色值的各分量综合考虑,得到灰度边缘图像I1。再用Laplace算子对I1做二次边缘提取,得到灰度边缘图像I2。在I2的基础上,采用最小误差方法求得分割阈值,并用该阈值对I1进行二值化处理,从而完成彩色图像的边缘提取。 利用彩色图像文本区域与背景之间存在明显边缘轮廓的特点,本文给出了彩色图像文本提取算法—TEA(Text Extraction Algorithm)。该算法首先利用CEDO进行彩色图像边缘检测,然后采用形态学膨胀技术生成区域图像,并结合区域生长算法标记候选文本块,最后通过分析文本块密度和空间频率特性来判定真正的文本块,从而较好地完成了彩色图像的文本提取。 本文对彩色图像的文本提取进行了比较透彻的阐述后,在一个简化模型基础上,详细描述了彩色图像文本提取系统的处理流程:预处理、彩色边缘检测、阈值计算及二值化处理、候选文本区域生成、文本区域提取。实验验证了TEA及CEDO的有效性。