论文部分内容阅读
可重复书写笔记本的内页是由特殊材质制成,使用热敏水溶性墨水在内页上书写。当笔记本记录完后可以使用加热的方式消除整本笔记,重新获得一本新的笔记本。笔记本内页由基材跟涂层组成,涂层具有良好的回弹性,书写后不会留痕,可以重复500次使用。因此,可重复书写笔记本具有节能减排,减少资源浪费的特点。可重复书写笔记本上的内容在用完整本笔记本后擦除,所以用户往往需要在笔记本重复使用之前就将笔记本中的信息提取存放到电子设备中。因此需要研究基于可重复书写笔记本的信息提取技术,把整本笔记本以PDF电子稿的形式存储在手机APP中。笔记本信息提取技术包含以下几方面:为了后期良好的阅读性,需要对手机摄像头拍摄到的照片做图像处理,通过边缘检测从复杂背景中提取出笔记本内页;由于手机摄像头拍摄时点光源的原因,内页上会有阴影的存在,需要通过图像处理算法去除阴影;为了后期检索查找方便,图片上的文字需要做OCR识别,方便用户通过关键词搜索快速定位到目标内页。第一章为绪论。主要介绍了全文的研究背景和研究目标;梳理了图像处理算法、图像边缘检测、脱机手写体文字识别、信息提取技术等方面的发展现状和国内外研究现状;提出了可重复书写笔记本内容信息提取所应当研究的关键技术。同时介绍了论文的框架以及研究意义。第二章为可重复复书写笔记本内页图像的阴影处理研究。研究了图像阴影处理过程中所涉及到的高斯模糊、平滑处理、二值化、字符分割以及归一化。提出了改进的图像增强算法,然后进一步优化了该算法。最后提出了一种新的黑白增强算法。第三章可重复书写笔记本纸张的边缘检测及内容提取,提出了改进的Canny边缘检测算法,能够有效的检测出图像中纸张边框的轮廓,然后进行纸张定位裁剪出需要的内容,最后使用透视变换进行畸变校正,得到正视图像。第四章针对手写中英文OCR识别中因特征选取差异而带来的识别准确率不高的问题,继而采用基于卷积神经网络在深度学习领域的优势进行OCR识别。通过大范围的训练,识别率相对于传统特征识别有了很大的提高。第五章是可重复书写笔记本信息提取系统的设计与实现。对主要模块进行功能分析、架构设计,开发了 Android以及iOS客户端,监控及分析了产品运行过程中产生的异常数据,该系统已经在可重复书写笔记本产品上得到应用。第六章是总结和展望。总结了论文的工作内容以及创新点,同时展望了后期的研究方向。