脱机—联机样本骨架化联合训练的DBLSTM手写英文识别

被引量 : 0次 | 上传用户:wangliang19910125
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写英文识别因其实用背景和较高的难度吸引了大批研究者的兴趣,而近年来无切分方法和深度学习方法的兴起也为这一领域注入了新的活力。传统上手写英文识别因为原始数据形式的不同分为脱机手写识别和联机手写识别两种,因而一般会对其分别建立识别系统。本文将无切分方法和深度学习框架基础上,对脱机-联机手写英文识别的联合训练方法进行研究。我们在得到图像对比度归一化及手写文字歪斜矫正的文字行图像基础上,首先构建了基于DBLSTM-HMM框架的手写识别系统,其基本思想为:首先训练GMM-HMM模型以实现自动切分,在强制对齐算法下得到每一帧特征向量和HMM状态之间的一一对应关系,并利用这种对应关系来训练DBLSTM循环神经网络,使其能够对新的数据结合其上下文信息进行分类。识别时将HMM转移概率,DBLSTM网络对每个HMM状态预测的后验概率,词表限制及语言模型概率结合起来,在Viterbi解码算法下寻找最优路径。本文在IAM脱机手写英文数据集上对此系统进行了验证,并优化了DBLSTM网络结构。为了进行脱机和联机手写样本的联合训练,本文中将联机手写样本绘制为了静态手写图像,并使用骨架化方法将脱机样本和联机样本都转化为笔划为1像素宽的手写骨架图像以模糊两者的界限。之后使用融合样本进行DBLSTM-HMM系统的训练。融合样本的使用能够极大地扩充训练样本的数据量,提升识别系统的鲁棒性。在IAM脱机-联机手写数据集和微软INK联机手写数据集上的实验表明,使用融合样本训练得到的系统相较于使用单一样本能够在脱机和联机两种类型的测试集上均得到更好的识别准确率。本文在DBLSTM-HMM混合识别框架下,创新地使用骨架化方法将脱机和联机手写英文样本进行融合以进行联合训练。实验结果证实了这种训练方法的显著效果。
其他文献
对总温畸变研究中关于温度瞬变、总温畸变指数、总温畸变生成系数、总温畸变与喘振压比损失关系等的有关定义和关系进行了介绍和论述。
木兰科植物是性状原始、分布广泛的双子叶植物,素为世界各国植物学家所瞩目和推崇。它们不仅具有药用、材用、工业用等各种经济用途,还具有绿化、美化、香化环境等多种生态功
研究了酸、碱、糖、加热对羊初乳中免疫球蛋白(IgG)稳定性的影响。结果表明,IgG在pH值为5.0 ̄10.0范围内比较稳定,在pH值为低于5.0条件下,随pH值降低,变性率剧烈上升;在加热或p
<正>人社部发布《规范跨省异地就医住院费用直接结算有关事项通知》,通知要求,2018年2月底前,要确保每个县区至少有1家跨省异地就医定点医疗机构。同时强调,严格跨省异地就医
翻转学习有利于拓展学习资源、展示学生差异、平衡虚拟课堂与现实课堂。开展有效实际的翻转教学,有利于实现泛在化学习与教育公平。
改革开放以来,国民经济快速发展的同时,自然资源被大量征用,自然资源短缺问题逐渐显露,可持续发展成为新时代的主流。在建筑领域,绿色建筑设计理念因其对节能减排的贡献和建
在立法不完善,司法机关不独立,行政权扩大和传统行政观念的综合影响下,我国行政诉讼应诉制度还不够健全。行政机关在行政诉讼应诉时,如何在外部和内部都形成良好约束机制,从
人机交互研究领域已有悠久的研究历史。随着计算机技术的发展,人们追求越来越智能化的交互方式,如图形交互、语音交互、手写交互等。这些交互使得人与机器进行类似于自然语言
目的(1)明确骶髂关节的CT解剖特点,进行相关参数的测量,为骶髂关节疾病诊断与治疗提供解剖学基础。(2)探讨骶髂关节炎CT影像特点及诊断标准。方法选取2014.1-2014.7期间于厦
目的探析中医综合治疗腰间盘突出症临床疗效。方法选取我院就诊的腰间盘突出患者78例作为本次研究对象,并给予中医综合治疗。结果显效为32例,有效为41例,无效5例,总有效率为9