基于彩色图像的文本区域提取研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:tdsl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字图书馆的兴起、多媒体信息检索和Internet技术的发展,彩色图像文本提取受到越来越多的重视,并应用于Web搜索、复杂文档的自动处理和各种图像数据库的检索等信息管理方面。图像中所包含的文本信息具有很重要的意义,通常形成对相关图像内容的简练描述或说明。自动定位图像中的文本区域,并提取这些文本信息,通过对它们的识别和分析,对于图像理解、检索查询是很有帮助的。 对于彩色图像中的文本来说,其字符排列有序,字体颜色基本相同,最重要的是字符本身与背景之间存在着明显的边缘轮廓。因此在进行彩色图像的文本提取时,有效利用文本的上述特点是十分重要的。 本文在借鉴文献[11]的基础上,对其提出的彩色边缘检测算子进行了改进,给出了CEDO(Color Edge Detection Operator)算子。CEDO算子是一个全面作用在RGB颜色空间三个分量上的边缘检测算子。它首先将灰度图像边缘检测算子Roberts算子推广到彩色图像边缘检测中,采用欧氏距离将像素彩色值的各分量综合考虑,得到灰度边缘图像I1。再用Laplace算子对I1做二次边缘提取,得到灰度边缘图像I2。在I2的基础上,采用最小误差方法求得分割阈值,并用该阈值对I1进行二值化处理,从而完成彩色图像的边缘提取。 利用彩色图像文本区域与背景之间存在明显边缘轮廓的特点,本文给出了彩色图像文本提取算法—TEA(Text Extraction Algorithm)。该算法首先利用CEDO进行彩色图像边缘检测,然后采用形态学膨胀技术生成区域图像,并结合区域生长算法标记候选文本块,最后通过分析文本块密度和空间频率特性来判定真正的文本块,从而较好地完成了彩色图像的文本提取。 本文对彩色图像的文本提取进行了比较透彻的阐述后,在一个简化模型基础上,详细描述了彩色图像文本提取系统的处理流程:预处理、彩色边缘检测、阈值计算及二值化处理、候选文本区域生成、文本区域提取。实验验证了TEA及CEDO的有效性。
其他文献
利用手机小巧便携安全稳定的特点,采用GSM短信和WAP推送技术,实现了学校短信信息管理系统,解决了原管理信息系统信息索取不方便、不快捷、不能随时随地查询等问题,提高了工作效率
摘 要:随着汽车成为人们日常生活中必不可少的出行工具,因此汽车行业也就成了促进社会快速发展的基础组成部分,而汽车检测与维修技术专业则是向汽车行业输送专业汽车检修人才的重要一部分。因此汽车检测与维修技术专业如何在短时间内向市场提供更加优秀的专业性技能人才是当前该专业所需要主要解决的问题。而目前随着现代化技术的不断发展,为汽车检测与维修技术专业带来了新的挑战与机遇,专业建设需要符合时代的发展,不断创新
随着计算机和通信技术、宽带网络技术、音视频压缩技术以及计算机硬件技术的发展,图像和视频中的文本信息对索引、检索及高层语义的自动理解等具有重要价值。本文主要研究如
摘 要:随着教育行业的不断革新以及素质教育在我国的不断实施与推进,提高并培育学生德育的工作逐渐成为教师的教学重点之一。小学音乐教学不仅能够帮助小学教师提高学生的音乐素养,还能大幅度提高小学生的音乐综合能力。因此,小学音乐教师在教学中渗透德育教学,能够在培育学生音乐能力的同时,提高学生的道德素养水平,并满足时代教学的根据需求。然而,目前小学音乐教学在渗透德育教育的相关工作,仍存在一系列的教学问题问题
针对TCP模型的非线性本质以及网络中存在的不确定性因素如TCP连接数、回路时延、链路带宽,提出了基于滑模控制(SMC)的主动队列管理(AQM)算法,该算法对不确定性具有很强的鲁棒性,
2006~2016年间中韩两国经济发展迅速,其服务贸易额总量不断增加,然而在运输服务贸易的发展过程中,中国与韩国相比仍存在很大差距。本文通过运用TC指数分析我国和韩国的运输服
资源发现是网格技术的一个非常重要的方面,资源发现就是找到与预想的资源描述相匹配的资源.当前对网格资源匹配的研究主要集中于精确匹配,而在模糊匹配方面做的研究较少.通过引入