【摘 要】
:
脱机手写体识别就是将包含手写体字符的图像转换为计算机可以编辑的文本信息的过程,在处理历史文档、邮件信息、行政公文等领域有着广泛的应用。搭载深度学习这一“快车”的脱机手写体识别是模式识别和人工智能领域研究的一个重要分支。目前,针对传统方法识别过程繁琐、难以设计出泛化性能较好的模型等问题,基于深度学习的端到端模型在脱机手写体识别领域逐渐成研究的热点。端到端的脱机手写体识别能够同时完成字符的检测和识别任
论文部分内容阅读
脱机手写体识别就是将包含手写体字符的图像转换为计算机可以编辑的文本信息的过程,在处理历史文档、邮件信息、行政公文等领域有着广泛的应用。搭载深度学习这一“快车”的脱机手写体识别是模式识别和人工智能领域研究的一个重要分支。目前,针对传统方法识别过程繁琐、难以设计出泛化性能较好的模型等问题,基于深度学习的端到端模型在脱机手写体识别领域逐渐成研究的热点。端到端的脱机手写体识别能够同时完成字符的检测和识别任务,无需显式的字符切割,极大地提高了文字识别的实时性。由于书写的自由性,同一个字符的不同实例,不同的人书写将不可避免地出现一系列相当不同的字形。从同种意义上说,同一个书写者的同一字符,也可能会由于书写上下文环境的不同而不同。目前,关于脱机手写体识别的研究主要针对数据量较小的数据库,要快速收集庞大的带注释的训练集数据成本很高。书写风格的多样性和标记数据的稀缺性,使得脱机手写体识别仍然是一个具有挑战性的课题。传统的脱机手写体识别过程包括图像预处理、字符分割、提取特征以及识别。目前更流行的是基于深度学习的端到端手写体识别,将手写体文本转换为序列识别问题,通过序列到序列模型实现图像序列到字符序列的映射。本文在脱机手写体识别问题进行深入研究,立足于深度学习的端到端模型结构,对脱机手写体识别进行以下研究工作:(1)基于深度学习的端到端脱机手写体识别目前主要有基于CTC(连接时序分类,Connectionist Temporal Classification)和基于 Attention 机制的两种模型,它们都有着较好的识别准确率。但是,基于CTC的模型假设标签内部之间具有条件独立性,每次输出的是独立的单个字符概率,忽略了整体信息;基于Attention机制的模型未引入任何引导对齐约束条件,对严格输入和输出单调对齐的手写体文本识别容易产生错位现象。针对上述问题,本文提出了一种基于CTC-Attention机制的端到端脱机手写体识别模型,基于Encoder-Decoder框架,利用多任务学习,并引入动态调整参数的方法来均衡CTC模型和Attention机制模型,在开源的脱机手写体英文单词IAM数据集和脱机手写体中文文本行CASIA-HWDB2数据集上验证了模型的有效性,实验证明提出的模型有着更高的识别准确率。(2)尽管(1)中提出的混合模型能有效实现端到端的脱机手写体识别,但这样的混合模型结构复杂,训练耗时长,要训练出性能较好的模型需要大量已标记数据。目前脱机手写体识别公开的数据集规模无法达到类似于ImageNet数据库的规模,因此,本文提出了一种无监督领域自适应的脱机手写体识别模型。领域自适应是迁移学习中的一种代表性方法,源域和目标域样本共享相同的特征和类别,但数据分布不同。传统的监督领域自适应中源域和目标域都带标记,而无监督领域自适应目标域不带标记。无监督领域自适应通过训练合成的源域和已有的目标域数据,利用未标记的目标域来减轻域偏移,对齐源域和目标域之间的特征分布来调整模型,使其推广到目标数据集上。该模型使用编码器-解码器框架集成对抗性策略的领域自适应来进行识别,由识别器和域分类器两部分组成,借助梯度翻转层,进行对抗学习,实现领域自适应过程。本文分别在脱机手写体英文单词和脱机手写体中文文本行数据集上进行了实验,证明提出的模型能够达到和传统有监督方法相媲美的识别准确率,而不需任何昂贵且耗时的手动标记操作。
其他文献
自1960年第一台激光器发明以来,激光因其出色的性能迅速引起人们的关注,成为世界上最优质的光源。激光与半导体、计算机、原子能一起被视为20世纪的现代四项重大发明,对人类社会产生了深远影响。目前,激光技术已经渗透到了各个学科领域,使多个学科换发了新的活力,极大地促进了这些领域的技术进步和发展。在多种类型的激光器中,光纤激光器凭借结构紧凑,集成度高,插入损耗小,成本低廉等一系列优势脱颖而出,成为传统工
人工神经网络是一种模仿生物神经网络结构与功能的数学模型,应用类似于大脑神经突触联接的结构进行信息处理.这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的.作为两类特殊的神经网络,耦合神经网络可以更好地描述生物复杂神经元的特征,而忆阻神经网络在下一代类人脑计算机中具有重要的潜在应用,因此近几年来它们受到了广泛的关注.本文研究了参数失配情况下的分数阶耦合时滞忆阻
脱支淀粉由于其线性螺旋结构,使其作为食品级载体具有更高的热稳定性和机械稳定性。脱支淀粉(DBLS)的精细结构会影响回生模式,从而影响其作为生物活性物质递送载体的潜在用途。本研究采用压热、普鲁兰酶脱支和/或超声波级联制备脱支扁豆淀粉,并将DBLS作为壁材对芦丁进行包埋,以提高芦丁分子在水中的溶解性和稳定性。对其包埋效率、结构特征、热稳定性、形态特征、抗氧化活性以及在模拟胃肠道消化环境下的体外释放行为
《1861-1863年经济学手稿》由23个笔记组成,是《资本论》第二大手稿,主要涉及剩余价值理论、工资理论、生产劳动理论、社会资本再生产理论、地租理论、资本积累理论、平均利润和生产价格理论、科学技术与生产力理论、资本主义发展方向理论等。在资本主义社会里,资产阶级宣扬平等、自由、公正的价值观。然而现实却相反,不平等、不自由、不公正的现象随处可见。“现实的人”从封建社会摆脱出来又陷入资本主义社会的束缚
菖麻熄风片主治小儿多发性抽动症,及胸中有痰者;主要表现为喉中异常发音,烦躁易怒,多梦易惊等。但儿童食道狭,吞咽药物困难,片剂加入赋形剂,并经过压缩成型,与口服液相比溶出速度慢,生物利用度低;本研究在菖麻熄风片的基础上进行二次开发,应用现代制药技术研制出口服液剂型。其与片剂相比具有浓度高,用量小,口感好,作用快,能分剂量等优点。在工艺方面,以挥发油提取率为指标,运用正交实验,对石菖蒲挥发油的提取工艺
随着经济的全球化发展,诸多时尚零售品牌、尤其是跨国公司的价值链也呈现出高度的全球化,其日常经营活动包括开发、采购、生产、物流、销售都在全世界范围内展开。近年来,以顾客需求为导向的供应链成为企业核心竞争力之一,而供应商管理成为各大企业运营中的重点关注环节,因为这对降低采购成本、保证产品质量、提高企业的商业效率、扩大经营利润有着举足轻重的意义。与此同时,当经济高速发展,伴随而来的环境与生态恶化等影响人
伴随着石墨烯的问世,众多新型二维材料由于其丰富的结构和独特的光学及电学性质而备受关注,研究表明此类材料在新一代电子和光电子器件等领域中具有广阔的应用前景。然而,石墨烯由于带隙为零导致其场效应晶体管器件无法有效关闭,因而极大地限制了其在现代电子产品中的应用。近年来,科学家发现了众多类石墨烯结构的二维材料,其特有的层状结构和带隙宽度赋予了其独一无二的光学和电学性质。使得它们在下一代半导体电子器件(例如
光化学反应的优势在于反应过程清洁,并且选择性高。常见的光化学反应有光加成、光解离、光氧化和光致异构化等,特别是双键的光致异构化反应在人的视觉、维生素的生产以及人工分子马达中扮演着非常重要的角色,因而被人们广为熟知。在实际生活和众多科学研究领域,光致异构化过程研究激发了人们的极大研究兴趣。对于光致异构化,其实际上在激发态经过化合物一系列复杂的结构变化,这涉及到很多激发态光化学问题。比如光致关环、光致
燃料电池是种极具研发前景的新型发电设备,但是阴极涉及的氧还原反应(ORR)缓慢的动力学速率限制其发展。设计合成高活性、原料易得的无金属氮掺杂碳ORR催化剂是当前亟需解决的科学问题。ZIF-8由于比表面积高、金属Zn高温易挥发以及丰富的含氮量等特点成为具有潜力的无金属氮掺杂ORR电催化剂前驱体。但是,ZIF-8直接衍生的氮掺杂碳材料的活性被微孔结构和导电性差所限制,针对此科学问题,本研究以改善孔结构
构造出基于p型金属氧化物的高性能气体传感器一直是气敏领域的研究热点和难点。因此本文以改善p型氧化镍(NiO)的气敏性能为目的,通过构建异质结和贵金属复合对其进行改性。利用静电纺丝技术制备出了一系列Nb2O5-NiO复合纳米纤维和不同比例贵金属Rh修饰的Rh-NiO复合纳米纤维。系统地研究了Nb2O5/Rh的含量变化对NiO纳米纤维的表面积、吸附氧能力以及丙酮气敏性能的影响,为高性能的NiO基气体传