论文部分内容阅读
图像文本信息的定位与识别在数字图像信息、视频数据库和Web地址的检索应用中十分重要.但文本信息通常镶印在图像的复杂场景中,其检测相当困难.提出了一种能够自动水平校准检测不同大小、字体、颜色和语种的图像文本信息的鲁棒方法.它首先对待测图像进行小波变换,将高频小波系数的分布状况作为文本区与非文本区的统计特征,然后应用K-均值算法分类出图像中的文本区,再经过投影分析以更精确地定位.最后,生成作为OCR引擎输入值的二值文本图像.所提出的检测方法的性能通过试验得到了验证.