论文部分内容阅读
作为人工智能的重要方向,OCR技术发展至今已较为成熟,并在各个行业中取得了较为广泛的应用。OCR的应用领域已经逐渐从大型企业和政府机构扩展到了各类企业和大众的同常工作中。而伴随着计算机技术的飞速发展,人们开始大量使用各种架构和操作系统的计算机和手持设备提高其工作效率和生活质量。并期望OCR技术能够应用于这些平台上。如何设计实现具有高度跨平台性能的OCR引擎以减少平台间移植的工作量,同时使该引擎具有较高的识别率和较少的资源使用量即成为OCR技术应用有待解决的重要问题之一。
跨平台OCR引擎的难点在于各个平台之间具有较大的平台差异,包括硬件相关的性能,操作和操作系统相关的系统调用和处理流程的不同。这些差异进而引起了引擎调试,测试方法的不同。
本文在对比了各个平台之间软硬件差异,在现有OCR技术基础上设计实现了具有高度跨平台性能的OCR引擎。主要的工作如下:
其一,分析了各个平台和系统之间差异,设计并实现了适用于跨平台OCR引擎的系统结构。该系统结构提供了一个具有高度跨平台,可伸缩的灵活的OCR引擎框架。基于该框架,OCR引擎能够快速移植到其它平台,并能够方便地添加相应功能模块并更改其算法。
其二,针对平台间软硬件接口的差异,提出了对这些接口的封装和抽象方法。真实案例表明该封装抽象方法能够较大程度上避免或减小不同平台接口差异对引擎的影响。
其三,对不同平台之间的调试,测试方法的共性和差异进行了具体分析,在一定程度上整合了相应的调试,测试方法。
其四,针对手持设备资源的资源限制问题,改进了传统OCR引擎内存管理和图像预处理方法。
使用三个完全不同的平台组合对系统进行评测表明该跨平台OCR引擎具有较好的伸缩性和跨平台性。