可重复书写笔记本信息提取的关键技术研究及应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:userlyc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可重复书写笔记本的内页是由特殊材质制成,使用热敏水溶性墨水在内页上书写。当笔记本记录完后可以使用加热的方式消除整本笔记,重新获得一本新的笔记本。笔记本内页由基材跟涂层组成,涂层具有良好的回弹性,书写后不会留痕,可以重复500次使用。因此,可重复书写笔记本具有节能减排,减少资源浪费的特点。可重复书写笔记本上的内容在用完整本笔记本后擦除,所以用户往往需要在笔记本重复使用之前就将笔记本中的信息提取存放到电子设备中。因此需要研究基于可重复书写笔记本的信息提取技术,把整本笔记本以PDF电子稿的形式存储在手机APP中。笔记本信息提取技术包含以下几方面:为了后期良好的阅读性,需要对手机摄像头拍摄到的照片做图像处理,通过边缘检测从复杂背景中提取出笔记本内页;由于手机摄像头拍摄时点光源的原因,内页上会有阴影的存在,需要通过图像处理算法去除阴影;为了后期检索查找方便,图片上的文字需要做OCR识别,方便用户通过关键词搜索快速定位到目标内页。第一章为绪论。主要介绍了全文的研究背景和研究目标;梳理了图像处理算法、图像边缘检测、脱机手写体文字识别、信息提取技术等方面的发展现状和国内外研究现状;提出了可重复书写笔记本内容信息提取所应当研究的关键技术。同时介绍了论文的框架以及研究意义。第二章为可重复复书写笔记本内页图像的阴影处理研究。研究了图像阴影处理过程中所涉及到的高斯模糊、平滑处理、二值化、字符分割以及归一化。提出了改进的图像增强算法,然后进一步优化了该算法。最后提出了一种新的黑白增强算法。第三章可重复书写笔记本纸张的边缘检测及内容提取,提出了改进的Canny边缘检测算法,能够有效的检测出图像中纸张边框的轮廓,然后进行纸张定位裁剪出需要的内容,最后使用透视变换进行畸变校正,得到正视图像。第四章针对手写中英文OCR识别中因特征选取差异而带来的识别准确率不高的问题,继而采用基于卷积神经网络在深度学习领域的优势进行OCR识别。通过大范围的训练,识别率相对于传统特征识别有了很大的提高。第五章是可重复书写笔记本信息提取系统的设计与实现。对主要模块进行功能分析、架构设计,开发了 Android以及iOS客户端,监控及分析了产品运行过程中产生的异常数据,该系统已经在可重复书写笔记本产品上得到应用。第六章是总结和展望。总结了论文的工作内容以及创新点,同时展望了后期的研究方向。
其他文献
本文从陶行知科学教育的实践及特色两方面较全面地论述陶行知的科学教育思想,阐述了它对我国基础科学教育的改革与发展,加速实现“科技兴国”的重要意义。
针对当前海军舰船通信领域网络资源异构、业务系统独立部署以及资源相互之间无法互连互通互操作的现状,提出一种基于栅格的舰船通信网络资源共享方法,在构建栅格资源表征模型的
目的观察西吡氯铵含漱液治疗牙龈炎、牙周炎的临床疗效。方法通过多中心随机平行对照试验观察,试验组用0.1%西吡氯铵含漱液,对照组用复方氯已定含漱液治疗,7d为一疗程,共使用
本文着重说明全球定位系统在数字消防中的应用。描述了全球定位系统技术的发展应用情况,分析了消防领域应用该技术的必要性和需求特点,阐述了全球定位系统在数字消防体系中的
分析企业培训无用论的原因,并对企业培训的几个阶段的条件要求作了深入分析,提出只是达到了基础条件要求的培训还不是成功的培训,只有注重培训课程结束后的实践(模拟实践)环
<正> 何尊是1965年出土于陕西宝鸡的重要铜器,有铭文一百二十二字,述及周成王时的大事及其年代。《文物》1976年第1期发表了唐兰、马承源、张政烺三位同志的考释,阐明了它的
根据GenBank中收录的鹦鹉热衣原体主要外膜蛋白(MOMP)基因序列设计合成1对引物,以禽源鹦鹉热衣原体基因组为模板,应用PCR扩增MOMP基因,将其克隆到pUCm-T载体上,并进行序列分
中国传统文论中存在的对真实性、写实手法的推崇以及社会关怀的精神与西方现实主义文论的特质之间具有的内在一致性。以此作为内在文化根基与认同基础,研究西方现实主义对我
教育在供给侧改革中扮演举足轻重的角色,政府不只提供设想、规划和领导,还应该参与到具体工作中,从而更好地引导市场发挥作用。
本文介绍了热释电传感器的基本原理,利用专门的传感器信号处理集成电路,结合语音芯片制作防盗报警器的实用电路,实验证明该电路具有良好的防盗报警功能,可广泛应用于家庭、宾