论文部分内容阅读
在现实生活中,文字作为信息的主要载体形式之一,承载着人类文明,向人们传播知识,弘扬文化,记录历史。随着电子信息技术的发展,出现了一维码、二维码以及彩色条形码等能够包含较多信息的条码图像作为信息载体,其中二维条码是主要的信息载体。然而,对于盲人和弱视力者而言,在获取文本信息或条形码信息时,仍存在诸多不便。这是因为目前市面上大多数文字识别或者条形码识别的工具是智能手机端的APP,使用时需要打开APP,并将摄像头对准文本区域或者条码区域。对于盲人和弱视力者而言,使用难度较高,且多数智能手机APP的识别结果仍是以文本的形式呈献给用户,所以并没有从根本上解决盲人和弱视力群体的阅读问题。因此,研究一款专门为盲人和弱视力者进行阅读辅助的设备就显得非常必要。本文旨在融合现有的可穿戴设备理念,设计一款专门为方便盲人和弱视力者使用的可穿戴阅读辅助系统,在研究和比对现有的文字识别或条码识别产品的基础上,对其功能和实现平台进行改进,结合无线网络,设计一款能实现文字识别和二维码识别的可穿戴设备,为盲人和弱视力者进行阅读辅助。本文主要工作内容及创新点如下:1、提出一种在资源相对较少的嵌入式平台下实现二维码译码的方法。通过本文选择的芯片所特有的位带存储区以及DMA(直接内存访问)双缓冲机制,快速完成图像采集、二值化和压缩存储;提出使用连通边界跟踪算法寻找二维码定位符,减少大量浮点运算;不对图像进行旋转,直接在当前旋转角度上进行采样,进而获取二维码比特流信息,实现二维码在资源相对较少的嵌入式平台下的译码。2、通过提取图像中各像素笔画宽度特征检测图像中的文本区域,较大程度地保留文本区域原始信息,检测效果较好。3、根据不同语言的字符差异,分析并提出利用字符分割时得到的最小外接矩形高度与宽度的比值、字符笔画宽度和字符间距等特点区分不同语言字符。4、使用半监督学习方式训练神经网络识别英文和阿拉伯数字,用Tesseract-OCR开源引擎识别中文简体汉字。实验发现,半监督学习算法训练英文字母和阿拉伯数字所花的时间较长,但训练好后,识别效果较准,速度较快;Tesseract-OCR也具有较好的汉字识别效果。5、设计了一款小体积、低成本的嵌入式可穿戴阅读辅助设备。在资源相对较少的嵌入式平台上实现图像识别、网络通信、语音朗读等功能。具体实现的功能主要包括,在嵌入式平台上实现二维码离线译码;通过无线网络,在服务器端实现文字在线识别。将嵌入式平台下二维码译码结果语音朗读给盲人或者弱视力使用者,也可将服务器端文字识别结果的GB2312编码通过无线网络发送至嵌入式平台的语音模块朗读。硬件设计上充分考虑设备的可穿戴性、低功耗、散热性等问题,设计出外观与手表相近的可穿戴设备,盲人和弱视力使用者仅需要通过简单的屏幕触摸即可阅读文字或识别二维码。本文所设计的可穿戴式阅读辅助系统,达到了成本较低,识别率较好,使用方便的效果。既方便盲人和弱视力的人阅读文献和二维条码,也方便语言学习者,儿童等人群的使用。部分代码和硬件设计方案已发布和托管到GitHub上。