【摘 要】
:
目前,OCR技术对简单版面的分析已经解决并得到了一定的普及,然而随着信息时代的到来,文本图像的版面已经不再是简单的文字和图形的组合,而是涵盖了文本、表格、图形和图像等
论文部分内容阅读
目前,OCR技术对简单版面的分析已经解决并得到了一定的普及,然而随着信息时代的到来,文本图像的版面已经不再是简单的文字和图形的组合,而是涵盖了文本、表格、图形和图像等多种内容,它是一种更加综合的形式,OCR对这种繁杂的版面识别效果不是很好,甚至无法进行有效地分析。因此,进行OCR识别前须对复杂版面进行有效地分析。传统的版面分析方法如:连通域法、投影法等已变得愈发不实用,运行时间过长、分析准确性不高,无法满足用户的需求;近年来,模式识别和机器学习中的许多方法运用到了版面分析中,支持向量机(SVM)便是其中一个,在结构风险最小化原则的基础上,运用核函数技术使低维到高维空间的非线性映射得以实现,其结构风险最小化原则避免了过拟合现象,提高了学习机的泛化能力,能够有效的处理复杂版面。本文针对报纸、科技论文、网页等具有复杂版面的图像,提出了一种基于机器学习的复杂版面分析方法,主要内容如下:1.从图像的关键特征入手,选择了图像的灰度、形状、纹理及相位一致性统计特征,并针对纹理特征中的灰度共生矩阵(GLCM)算法进行了深入的研究,结合和差统计法对其进行改进。通过后续的训练和测试证明,该方法能减少特征提取的计算时间和存储空间,并可达到良好的版面分析效果。2.针对复杂背景下的版面分割,选用支持向量机(SVM)和BP神经网络两种方法对图像中的文本区域进行了分割提取工作,并根据实验结果进行了对比与分析。3.在对分割后的版面进行分类的过程中,详细研究了支持向量机(SVM)实现多分类的方法,并针对其中存在的不可分区域问题,提出了一种基于距离测度的改进方法。经过测试,改进后的方法能够进一步提升版面分类的准确性。实验表明,本文采用的方法能够针对具有复杂版面的图像进行有效的版面分析,且其具有速度快、分析准的特点,有一定的应用前景。
其他文献
随着节能环保理念在各个国家大力提倡,燃油型汽车逐渐被淘汰,发展以清洁能源为动力的电动汽车成为各国新的研究方向。电动汽车性能的好坏关键取决于电池的性能,锂电池由于具有高电压、高能量密度、高安全性、低自放电率等优点,目前是电动汽车领域中使用率最高的动力电池之一。为了达到电动汽车输出电压的指标要求,一般是将多个锂电池单体串联成包,多个包再串联成组。串联电池组在多次循环充放电之后,即使是同厂家、同批次、同
动态场景图像置换技术,是将视频中每一帧图像中的一个或多个目标事物,根据用户需求用其他感兴趣的图像事物置换掉或将其置于新的背景下得到一组新的图像序列,从而得到一个新
受环境污染和能源危机的影响,电动汽车成为了汽车制造业未来发展的主要趋势,在电动汽车中,驱动电机控制系统的优劣决定着电动汽车驾驶的舒适性与稳定性,永磁同步电机以其高效率、高功率密度以及优良的控制性能成为了电动汽车驱动电机的首选。本文针对电动汽车电机驱动系统,对电动汽车用永磁同步电机控制算法以及无速度传感器技术进行研究与改进,主要包括以下内容:首先,研究了基于SVPWM的直接转矩控制策略,SVPWM可
互联网技术的迅猛发展和快速普及,直接影响着人们生活的方方面面,人类的社会行为也在潜移默化中发生着变化。高度信息化的社会像一个巨大的网络将地球上的万物包罗其中,地球
随着RFID技术的不断发展,RFID的应用越来越广泛,其中包含关系探测受到国内外学术界和产业界的广泛关注。现实生活中广泛存在包含关系,这种关系相比于标签对象间简单的伙伴关
随着移动技术的快速发展,基于位置服务的应用使人们的生活越来越便捷,用户在享受便捷服务的同时,个人数据的隐私泄露问题也愈发严重。本地化差分隐私,由于其继承了中心化隐私保护方法被广泛应用于保护用户个人的敏感信息,已经成为当前研究的热点问题之一。基于本地差分隐私下的发布数据所采用的方法有数据扰动、数据压缩和数据扭曲三种方式,其中最为常用的是随机聚集有序相应隐私保护方法(RAPPOR,Randomized
随着云计算的发展,产生了面向组件服务的云应用系统。云应用系统以业务流形式向用户提供服务,而不同的业务流中的不同任务被分配到不同的组件服务上,这些组件服务共同构建应
随着信息技术的高速发展和智能手机的普及,基于手机的室内定位技术逐渐成为研究的热点。目前在室内定位技术中,基于地磁匹配(MagneticMatching,MM)的室内定位方法,无需额外设
主从式遥操作微创手术机器人是国内外医疗领域的研究重点。微创手术可以为患者和医生带来诸多好处,如切口小、手术时间短、恢复时间快等。力反馈是当今微创手术机器人的研究
智能终端的普及与无线网络技术的进步推动了实时流媒体业务的蓬勃发展。如何通过多模终端的无线网络接口,利用多路径传输技术并发传输数据,为实时流媒体业务提供高质量的传输