【摘 要】
:
文本是存在于图像和视频中的重要的内容信息,自动定位并提取图像和视频帧中的文本区域,再通过OCR技术进行字符识别,最后提取出来图像中的文本,这对于图像理解,检索和浏览有十
论文部分内容阅读
文本是存在于图像和视频中的重要的内容信息,自动定位并提取图像和视频帧中的文本区域,再通过OCR技术进行字符识别,最后提取出来图像中的文本,这对于图像理解,检索和浏览有十分重要的意义。本文主要研究彩色图像中的文本区域定位和提取方法,研究的具体内容包括:多分辨分析、边缘提取、形态学处理、连通域分析、文本区域提取等五个方面。本文提出的方法改进了现有场景文本区域和图形文本区域提取方法,获得了更好的提取准确性。由于图像上字符的大小变化范围很大,为了能够找出大小不一的文本区域,本文利用多分辨分析方法将图像分解为原分辨率的1/1、1/2和1/4的三幅子图。然后对每幅子图应用相同的文本区域提取方法。由于文本分布方向有多种可能性,为了文本区域提取更准确一些,本文中提出了基于文本分布方向的数学形态处理算法,它的基本思想是:将文本分布方向分成水平、垂直、正斜角、反斜角四个方向来讨论,对不同的文本分布方向的图用不同的数学形态处理算法。在进行连通域分析的过程当中,求连通区域的高宽和连通区域规则化的时候又分多种情况讨论,进行详细分析,因而得到了更为理想的检测结果。在现有的文本提取方法中,有很多算法是针对特定样本集提出来的,一旦样本改变了,算法的效果就很不理想,而本文提出的方法不是针对特定样本集提出来的,因此适用范围相对广一些。
其他文献
<正>音乐学习,特别是音乐表演专业的舞台实践,显得尤为重要。近年来,各种形式艺术实践活动已成为学校教学的重要补充。随着四川音乐学院办学规模的扩大和办学条件的改善,现有
本文讨论初等对称多项式的性质,并举例说明它们的应用。
<正> 近年来的冬末春初,记者不止一次到金殿风景名胜区茶花园赏花,所见所闻,印象极深。 丰富多彩的金殿风景名胜区 金殿风景名胜区,位于昆明东北郊7公里的鸣凤山(又名鹦鹉山)
目的探讨黄芩总黄酮苷元(SBTF)对肝脏的保护作用。方法将70只小鼠随机均分为7组(空白组、模型组、阴性对照组、联苯双酯阳性对照组及高、中、低剂量黄芩总苷元给药组),每组10
目前对通常的冲击地压的发生机理已经有些基本认识,对其预测与防治已形成一些基本方法和技术。但迄今为止很少见到对高瓦斯煤层冲击地压的发生机理、预测、防治进行系统专门
以许渊冲的“三美论”为导向,对Mr.Ediard Connynkam和丁祖馨、拉菲尔的《再别康桥》两译本进行评析,旨在洞察不同的译者对原诗不同的解读,考察译者的翻译风格。
通过调研,掌握了国内外石油钻机绞车的发展现状与趋势,对现有在用电驱动钻机绞车进行了结构分析,了解了其优缺点,为进行新型钻机绞车设计奠定了基础。与传统机械钻机绞车和直
判断问题贯穿了阿伦特的整个政治思想生涯,其目标是双重的,一方面是为了确立行动概念在其政治思想中的根本地位,另一方面是为人类的共同存在提供根据。在考察了欧洲极权主义
“水族之最”是一座达到了杰出环境目标的高效能建筑,其中包含最近为温哥华水族馆增建的画廊和办公空间。项目在温哥华水族馆现有设施之外,增建了3707m2的办公空间、画廊和展
在互联网快速发展和智能手机日益普及的今天,媒体的多元化趋势越来越强,这为政务微信的运行和发展起到了积极的推动作用,不仅为政务微信发展提供了强大的机遇,同时也带来很大