基于OCR与词形状编码的英文扫描文档检索

来源 :模式识别与人工智能 | 被引量 : 10次 | 上传用户:vrace_zh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析当前常用的两类扫描文档检索方法:基于OCR和基于词形状编码的方法.提出基于识别信度将两种方法进行有机结合的思路.基于文档排字特性和笔画特征,还提出一种词形状编码方法,对字体有较强的容忍性.针对各种标引方法进行关键词检索对比实验,实验结果表明,本文方法性能较优越.
其他文献
提出了一种利用低功率He.Ne laser(λ=632.8mm,2.0±0.1 mW)光学无损诊断早期龋齿的方法,并与探诊方法、光子波动非线性转换方法(PNC)以及DIAGNodent龋齿诊断仪进行了比较.这
提出了一种基于直流电压注入的新型电压源换流器,该换流器由一个12脉动换流器和一个附加电路构成.附加电路通过变压器向12脉动换流器中点注入直流电压,将12脉动换流器变为60
提出了一种基于平行排列3×3耦合器的双环结构全光缓存器(DLOB)的级联方案,分析了单级和级联结构的缓存原理及读写方式,通过分析半导体光放大器(SOA)的噪声性能,得到光缓存器
通过介绍西藏文物古建筑(寺庙)现状、特点,分析了古建筑存在的火险隐患,对西藏古建筑防火进行了初步探讨.
因材施教之个性化教育在我国经济持续增长的今天,无疑在培养社会各行各业的专才和特才方面、在培养大学生的自主学习能力方面具有强大的优势和生命力.个性化教育必将为我国的
我国是一个水资源短缺的国家,尤其是北方大部分地区,都属于干早,半干旱地区.本文就我国干旱地区农业机械化与水资源环境发展,如何改善干旱地区水资源环境、加快干旱地区农业
2012年1月1日起国务院对上海市交通运输业和部分现代服务业进行营业税改征增值税改革试点,这标志着我国流转税改革的正式启动。本文主要从营业税的弊端和增值税的优势以及试点
由于历史原因叠滘片区内采用雨污合流制,污水未经处理直接排入河涌,严重污染了河涌水质.从保护环境出发,实施叠滘片区截污工程.本文对截污工程设计中排水体制的选择、截污形
由于半导体激光器在光电转换效率、输出功率、使用寿命等方面的优势,广泛应用于军事领域.为提高输出功率,将两束同一波长不同偏振态的激光束耦合以获得更高功率输出,是目前国
本文重点从环境污染源、环境污染对农业和绿色食品生产的影响、作物污染对人体的危害三个方面详细论述了绿色食品产地环境质量的重要性.分析了绿色食品生产对环境质量要素的