【摘 要】
:
印刷体数学表达式识别系统主要包括数学表达式定位、数学表达式符号识别、数学表达式结构分析和数学表达式重构四个组成部分。数学表达式定位是数学表达式识别的首要步骤,也
论文部分内容阅读
印刷体数学表达式识别系统主要包括数学表达式定位、数学表达式符号识别、数学表达式结构分析和数学表达式重构四个组成部分。数学表达式定位是数学表达式识别的首要步骤,也是本文的研究重点。科技文献中的数学表达式分为孤立表达式和内嵌表达式,针对中文文档特点,提出了一种基于统计特征的决策树与BP神经网络相结合的数学表达式定位方法,该方法分别定位孤立表达式与内嵌表达式,采用ID3算法对文本行属性特征进行分析,构造决策树,利用生成的规则定位文档中的孤立表达式;提取除孤立表达式外的其它行内水平连通块特征训练BP神经网络定位内嵌表达式。实验表明,该方法对中文印刷体文档中的数学表达式定位具有较高的正确率、容错率和速率
其他文献
随着Web服务的迅速发展,功能相同或相似的Web服务越来越多,服务消费者如何从众多服务中选择满足自己需求的服务成为业界关注的热点。服务信誉目前被解释为服务消费者对Web服务
随着Internet技术的发展,人们对通信隐私和信息安全技术越来越重视,二维工程图的安全性也逐渐引起人们的关注。当前的二维工程图加密算法还比较少,主要是对其格式的加密,对二
现有的逆半调方法大多都需要有半调类型的先验知识,因此对半调图像进行类型识别有助于提高逆半调方法的自适应性和逆半调方案的优化、建立。本文深入研究了不同半调技术的工
目前,移动终端如手机、PDA的数量已超过固定电话,无线通讯发展迅猛,如何做到让移动终端通过无线通讯手段随时随地获取INTERNET信息---移动互联网成为热点和技术创新点。WAP(W
microRNA(miRNA)是一类近些年发现的在转录后水平上对基因表达水平起到负调控作用的小的、进化保守的RNA分子。越来越多的研究显示miRNAs在癌症和其他恶性疾病的产生和发展的
随着计算机技术的不断发展,电信网、互联网、有线电视网之间的融合是大势所趋。作为传统电信网的替代技术,VoIP具有成本低廉、容易部署、升级方便、功能丰富等特点,是极具发
为适应我国航天事业的可持续发展,满足新一代运载火箭和新型航天器发射任务需求,2007年8月,国务院和中央军委正式批准在海南文昌建设新一代运载火箭发射场。日前,新发射场可行性
针对货物拆卸困难、有特殊要求不得开封、行李物品涉及个人隐私等特殊监管情势,采用X光检查设备对运输工具、货物或行李物品进行非侵入式扫描检查,从而实现准确、高效地检控,
随着模糊集合理论广泛应用于社会生产和生活中的各个领域,模糊关系数据库理论的研究与应用应运而生,但是由于模糊数据的特殊性,传统关系数据库管理系统己经不再适合处理这些
重新审视传统的网络架构,许多传统网络时分层的,多数以树形结构布置了众多的以太网交换机。当以客户端-服务器为主体时,这种设计是合情合理的,但是对于如今的企业数据中心、校园