【摘 要】
:
文档图像二值化是光学字符识别(OCR)预处理阶段的关键技术,其处理效果的好坏直接影响光学字符识别的识别率的高低.本文对几种全局阈值算法与自适应局部阈值算法进行了研究分
【基金项目】
:
“十一五”国家科技支撑计划重点项目(2009BAI71B02);北京市属高等学校人才强教计划资助项目(PHR20110865);北京市大学生科学研究与创业行动计划
论文部分内容阅读
文档图像二值化是光学字符识别(OCR)预处理阶段的关键技术,其处理效果的好坏直接影响光学字符识别的识别率的高低.本文对几种全局阈值算法与自适应局部阈值算法进行了研究分析,从理论模型和实例文档图像两个方面综合分析了OTSU法、迭代法、简单统计法、Bersen、Niblack、VFCM、NFCM等二值化算法.通过实验、对比分析表明,几种算法各自具有其优缺点,对一些复杂文档图像情况的适应性也各不相同.在实际应用中,应根据具体的文档图像质量、周围环境的光照,以及对图像处理时间的要求等情况选择合适的文档图像二值化算法.
其他文献
本论文对杭州地区社区获得性肺炎(Community-acquired Pneumonia,CAP)三种主要致病菌(肺炎链球菌、流感嗜血杆菌、卡他莫拉菌)的耐药性检测及肺炎链球菌对大环内酯类抗生素耐药机
水力喷射泵采油工艺及其配套技术在国内已有30多年的研究、应用历史。喷射泵依靠动力液携带的能量在泵内与油井产液进行能量转换来实现举升,泵本身没有可动部件,这就使喷射泵较
光子晶体作为有效提高LED出光效率的手段之一,在过去的十多年受到了广泛的关注。简述了光子晶体提高LED出光效率的物理原理。从GaN基LED不同光子晶体的结构、晶格常数和高度
钢筋混凝土包括预应力钢筋混凝土桥梁的耐久性是近半个世纪来人们普遍关心的问题。由于混凝土结构材料自身和使用环境的特点,混凝土结构存在着严重的耐久性问题。国内外有关资
科学设定、规范行使政府经济职权,是提高政府管理社会经济的水平和质量,促进经济持续快速健康发展的重要手段;是法学家和经济学家共同关注的问题。没有哪一位法学家或经济学家会
本文运用事实——价值二元论的方法,以合同法作为裁判规则为前提,从合同的定义入手,认为合同的本质是合意加债,合同的成立是一事实判断问题,判断结论只能是成立或不成立二种。判断
主要介绍浆粕气流成网技术的发展及其加工方法、加工过程及工艺,叙述了浆粕气流成网使用的原料及产品应用.
<正> 在砖混结构混凝土的现浇施工中,圈梁、构造柱支模木工工作量大,固定、支撑耗料多,易损耗。为此,我公司对传统的支模方式进行改革。使用钢筋下脚料轧制成一种可重复使用
一年级学生刚刚接触正规教育,他们的知识储备以及思维能力等方面还都处于较低的层次——对语文的阅读来说,一年级的识字量还远不能满足他们独立的阅读,他们的阅读意识和习惯
研究背景:人γδT细胞是一群存在于外周血、同时具备天然免疫和适应性免疫双重功能、可应用于肿瘤免疫细胞治疗的T细胞。γδT细胞可广谱但选择性的识别、杀伤功能异常或被感