论文部分内容阅读
近年来,随着数字化技术、信息化技术以及多媒体技术的迅速发展,有大量的数字图像、遥感图像、广告图像、路标指示牌以及微博(web)中的图像充斥着我们的生活。而这些图像中包含了丰富的语义信息,是智能控制系统和信息检测与检索系统的重要处理对象。提取和识别这些图片中的内容对于人们的日常生活和工作有很大的帮助,也减少了人工劳动的工作量。虽然国内图像分割与识别技术在学术与工业应用上取得了一定的成绩,但是在实际应用中,计算机对图像文本信息的识别和理解能力仍然达不到人们的要求。文字提取与识别主要包括文字区域的检测、文本区域的分割、文本的提取和文本的识别等,由于在彩色图像中一些图像本身的分辨率较低、背景比较复杂、亮度影响以及位置、形状与颜色具有不确定性等,针对彩色图像中文字提取与识别的上述问题,本文采用了一种基于K-means聚类和神经网络的方法。首先分析图像的特征,并利用图像分析、图像分割、图像增强等技术检测图像中的文字区域,然后将文字区域从彩色图像中分割出来,进行小波差值放大,再利用k-means方法对彩色图像聚类得到单背景彩色文字图像,进行二值化和文字切分处理,最后再利用神经网络对文字进行识别。实验验证,该方法在一定程度上可有效解决复杂背景图像中文字识别的问题。