【摘 要】
:
随着网络技术的迅猛发展,信息资源的电子化成为至关重要的问题。数学公式是许多科技文献的重要组成部分,手工输入困难,自动输入技术的研究就尤为重要。现有的OCR(Optical Cha
论文部分内容阅读
随着网络技术的迅猛发展,信息资源的电子化成为至关重要的问题。数学公式是许多科技文献的重要组成部分,手工输入困难,自动输入技术的研究就尤为重要。现有的OCR(Optical Character Recognition)技术虽然对中英文字符和数字等符号都能获得较好的识别效果,但无法处理数学公式。其原因在于数学公式具有复杂的二维嵌套结构,并且公式符号含义具有多样性,这使得数学公式在切分和结构分析方面存在很多困难。因此,数学公式识别已经成为OCR 领域的一个研究热点。印刷数学公式识别系统主要包括三个组成部分:公式提取、公式分析与识别和公式重构。公式分析与识别作为印刷数学公式识别系统的三个组成部分之一,其准确性直接影响公式重构的质量,是整个数学公式识别系统的关键。本文对公式分析与识别部分做了较深入研究。主要从以下几个方面进行了改进: 在公式字符识别阶段,针对公式自身的特点,提出了一种基于连通域搜索的公式字符切分算法,并通过公式字符识别结果的反馈信息对粘连字符实行切分,以改善字符分割的质量,在实验中采用该切分算法取得了比较好的效果。在公式结构分析阶段,以公式字符的识别结果为基础,根据公式字符的结构布局,采用“自顶向下”和“自底向上”思想相结合的策略对数学公式进行结构分析,构建数学公式的符号关系树,实验表明,这种策略对印刷公式结构具有较好的适应性。
其他文献
码分多址(Code Division Multiple Access,CDMA)技术是第三代及未来移动通信系统的核心技术,CDMA系统与其他通信系统相比,具有许多重要的优势,但CDMA系统是一种干扰受限的系
本文是针对电视节目中的音频信号进行的音频分割分类方法的研究.在对现有算法的充分研究和实验的基础上,实现了电视音频的分割分类系统.本系统主要包括音频分割和音频分类两
随着Internet 飞速发展,新的应用不断增多,对网络的实时性、服务质量要求越来越高。网络安全防护体系中大部分网络安全设备均处在网络的瓶颈位置上,当应用在大规模的网络时,
在ASIC设计的过程中,功能验证日益成为工作中的瓶颈。能否合理规划功能验证方案,使其能够在最大程度上保证设计的正确性,已经成为设计成功与否的一个关键因素。软件仿真作为功能
智能规划是人工智能的重要研究方向。它能将现实问题进行模型规划,通过规划模型求解现实生活中的复杂问题。近年来,不确定规划作为其分支,逐渐得到学者与工程领域专家的关注
Internet 的快速发展使计算机病毒的数量急剧增加,传播更加便捷和迅速。传统的病毒检测技术无法适应这些新变化,有效地防御病毒。对计算机病毒,特别是未知病毒的实时防御是现
本文研究聚类算法为目的,从元启发式算法角度探索合适的聚类结果,在已知和未知聚类簇数目条件下给出多个元启发式聚类算法;同时考虑入侵检测中存在的问题,给出两个基于遗传聚
随着信息技术事业迅猛发展,传统的表达方式和信息传输方式早已经不能满足人们的社会需求。网络视频会议和可视电话等一系列新的多媒体技术应运而生,通过无线和互联网来传输视
如何从图像中检测人员并对人员进行计数,从来都是数字图像处理和模式识别领域中的一个重要和热门课题。人数统计这一课题不但有较高的研究价值,并且具有很好的实用价值。在教室
本文通过对办公自动化系统现状与相关应用技术的分析,阐述了基于.NET平台下的办公自动化系统的Web解决方案.通过对系统以下几个方面的设计与实现,本文对Web技术中的系统架构