图像文本提取系统设计及应用研究

被引量 : 0次 | 上传用户:neu20063043
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本是计算机视觉的许多应用中的一项重要特征。图像中的文本存有很多有用的信息,对视觉内容理解和获取至关重要。文本定位是文本提取的一个重要步骤。文本提取的主要目的是将文本图像转化为符号形式,从而利于修改、存储、检索、利用及传输。其中关键点和难点就是准确快速的文本定位,原因在于自然场景的复杂多变性容易影响定位效果,且主流手机设备硬件资源也限制了现有的定位算法(基于区域、纹理、边缘的方法,或结合三类方法优点进行融合的方法)的实践应用。随着多媒体技术和智能手机设备的发展和普及,基于手机设备的文本分析也有了较大的需求,然而基于手机设备的图像处理技术没有通用的框架,本文是在没有成熟的算法和应用的背景下,进行一次探索性的研究和应用。本文主要针对基于Android智能手机设备自然场景文本分析进行研究,实现和改进了一种图像文本定位算法,可以准确快速地定位图像中的文本区域,同时提出一种基于SWT的图像二值化方法。在本文的文本定位算法中:第一,我们给出了输入图像SWT(笔划宽度变换)的详细步骤,并改进了滤波的过程,计算复杂度与边缘像素呈线性关系,具有计算简单的优点;第二,在笔划宽度变换的基础上提出了中文合并算法,解决了传统合并算法处理中文合并时效果不甚理想的问题,基于SWT(笔划宽度变换)提出一种图像二值化方法。同时,本文又重点研究了在Android平台上文本定位程序的开发:第一,考虑到手机设备的硬件条件,利用和修改了其中的一些模块,应用OpenCV图像处理函数库,实现了图像文本提取系统的核心模块——文本定位模块;第二,应用MVC软件设计模式并实现了基于Android平台的文本定位终端软件。并通过ICDAR和本文的数据集,检测了算法的定位效果。本文的设计思想和方法对文本定技术研究和产品开发具有一定的参考价值。
其他文献
政府流程再造作为政府治理模式创新的一种重要范式,广泛存在于政府治理活动之中,逐渐成为改善政府治理绩效、提高政府治理能力,以及最大化公共利益等影响政府治理目标顺利实
近年来蓄电池由于具有容量大、功率密度高等优点而被广泛应用于煤矿电机车、不间断电源等多种领域。充电电源作为蓄电池的能量补给设备与蓄电池相生相伴,其性能的优劣直接影
物价稳定作为经济稳定和社会稳定的重要基础,是衡量一国宏观经济运行是否健康、平稳的重要标准之一。物价稳定一直以来都是各国努力达到的宏观经济目标之一,这对于处于重要发展
高速发展的汽车工业已经引发了全球范围内的严重能源和环境问题。日益严格的排放和燃料效率标准促进了安全、清洁、高效的新能源汽车的发展。作为“十五”期间电动汽车“三纵
目的探讨清代消渴医案特点,挖掘清代医案中体现的消渴学术观点和诊治规律。方法采用检索词检索和人工阅读的方式收集文献,将搜集到的清代消渴医案输入Word文本,与纸质书籍校
将小型无人直升机与低量喷雾系统有机结合实现低空低量喷洒是一种现代化的施药方式,具有效率高、喷雾效果好、劳动强度低、自动化程度高、灵活性好、及时有效等特点,相比于固
在发展智能电网的新形势下,急需研究分布式能源、储能装置、充电站、微网等带来的电网双向潮流、双向信息互动、实时电价等新情况下的电能计量新问题。无功计量收费是大势所
目的:探讨内镜下机械碎石术治疗胆总管大结石的价值.方法:32例经ERC证实胆总管结石直径≥1.5cm.其中结石直径1.5~1.9cm17例,2.0~2.4cm9例.≥2.5cm6例,单颗结石24例,2颗结石5
miRNA是近几年发现的对基因表达进行转录后调控的小分子RNA,研究证实其参与脂肪组织发育相关的许多生物学过程调控。至今,有关猪脂肪组织发育过程表达的所有miRNA尚没有确定
研究背景和目的间质性肺疾病( ILD) :是由各种不同原因引起的累及肺间质、肺泡、细支气管的肺部弥漫性疾病,其以非特异性肺泡炎伴肺间质纤维化为共同病理改变,具有类似的临床