基于深度学习的货运列车字符识别方法研究

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:wang1224
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习近年来被广泛应用在字符识别、图像识别、语音识别及其他领域中,而且都取得了显著的成效。而卷积神经网络作为深度学习里重要的一个算法,因其良好的特征表现能力而备受关注。字符识别因实际需求,也变得越来越热门,更多的人开始进行字符识别方法的研究,如车牌字符识别、芯片字符识别、身份证号字符识别、自然场景文本识别等。货运列车作为我国运输业中经常使用的运输方式,其自动化管理必将越来越受到重视。而货运列车字符识别作为其中重要的一环,也面临着更大的困难和挑战。本文对于实际场景中的货运列车字符,基于深度学习方法,通过构建不同的深度神经网络来进行字符识别研究,主要工作如下:(1)设计了基于Inception网络的货运列车字符识别方法。分析了Inception网络的结构和性能,设计了基于Inception网络的字符识别模型,在特征提取网络加入多尺度特征提取模块和Inception模块。在前部网络层加入大小不同的卷积来进行多尺度特征提取,并进行特征融合,然后借鉴Inception网络模块多支路能够学习不同尺度特征的优点,设计了新的网络结构。再将提取的特征输入blstm层进行序列预测,最后使用CTC进行字符转录。实验结果证明,基于Inception网络的识别模型显著提高了货运列车字符的识别率。(2)设计了基于Densenet-Inception网络的货运列车字符识别方法。为了获取更多的底层信息和图像特征细节,提高特征提取能力,本章采用了Densenet,分析了Densenet在特征提取上的优越性。在保留Densenet特征重用的优点上,引入Inception网络模块,将Densenet和Inception网络结合,构成新的DensenetInception网络。实验结果证明,改进后的网络模型对于货运列车字符数据集的识别率有所提高。(3)搭建并实现了货运列车字符识别系统。该系统使用C++语言和Qt5图形界面设计工具,将East字符检测定位算法和本文设计的字符识别模型相结合,对货运列车字符图像进行字符识别。
其他文献
蛋白质结构预测的研究对了解蛋白质功能、促进蛋白质工程以及药物的研发具有重要意义。而跨膜蛋白则是蛋白质中结构比较特殊的一类蛋白,其通过特殊的跨膜结构穿透磷脂双分子层长期稳定地固定在生物膜上,是生物膜功能的主要承担者。因此,跨膜蛋白结构的研究具有非常重要的生物学和医学意义。根据跨膜区结构的不同,跨膜蛋白可以分为α螺旋和β桶状跨膜蛋白两大类。作为跨膜蛋白中重要一类的α螺旋跨膜蛋白,其结构的研究对于跨膜蛋
RNA与蛋白质的相互作用在许多重要的生物学过程中起着重要的作用。基于新一代测序技术的创新和发展过程,数以百计的RNA结合蛋白(RBP)及其相应的RNA被逐渐发现。通过对其生物学进程的总结和分析,使得在计算生物学方面,利用机器学习的方法对RNA-蛋白质相互作用进行大规模预测成为可能。到目前为止,在计算生物学领域的学者已经在此问题上探究和开发出了多种计算工具和方法,其中就包括深度学习模型,同时也利用基
在“互联网+”时代,随着信息量的不断扩增,人们的兴趣也变得多种多样,如何使人们在巨量的信息中快速准确地找到符合需求的信息就成为当下亟待解决的问题。推荐系统作为一种有效的信息过滤手段被广泛应用于工业界和学术界,因此对推荐系统的研究也成为最热门的课题。大多数推荐方法一般都采用深度学习与协同过滤相结合的方法,在一定程度上提高了推荐的性能,然而这些方法依然存在以下四个问题:(1)不能捕获用户动态变化的兴趣
光学字符识别(Optical Character Recognition,OCR)技术始于上个世纪六十年代中期。深度神经网络出现后,识别对象由印刷体字符发展为自然场景字符,目前基于深度学习的OCR已经成为机器视觉领域中的一个重要研究课题。随着中国制造2025的提出,推动我国的工业面向信息化发展,字符识别技术在工业环境中的应用受到了广泛关注。区别于高分辨率、高清晰度的文档字符图像,复杂的工业环境中字
物联网(Internet of things,IoT)的应用开发前景越发广阔,大量的智能环境可以连接到脑机接口(Brain Computer Interface,BCI)系统上。BCI系统是一种连接人类大脑与外部设备的实时通信系统,直接将大脑产生的信息转换成驱动外部设备的命令,取代人体或言语器官与外部世界进行通信。简而言之,BCI系统可以代替人体大脑周围神经和肌肉组织,实现人与外界环境的沟通。BC
本文研究内容是多维背包问题,多维背包问题的目标是在满足所有维度下的限制条件找出被选择的物品总价值最大的组合,它是NP难的组合优化问题,在计算上具有挑战性并且在生活中应用广泛,多维背包问题广泛存在于货物装载、削减库存、项目选择、资金预算、解决处理器和数据库在分布式计算机系统上的分配问题等方面。因此,求解多维背包问题具有重要的理论指导意义和实际应用价值。本文提出随机采样预处理的方法来求解多维背包问题,
在实际生活和工程实践中,多个待优化目标经常同时出现,大量此类问题采用进化算法来求解,因此多目标进化算法的研究有着重要的理论意义和实践意义,也成为了近些年研究的热点。然而在解决具有较小或非连续可行域的问题中,大多数算法由于不可行域的阻碍无法收敛到Pareto前沿。同时,固定的变异参数使得优秀解和劣质解具有相同的变异概率,无法满足算法在进化过程中对保存优秀解,尽可能地改善劣质解以提高算法收敛性与多样性
卷积神经网络已被广泛应用于自然语言处理领域。句子情感分类是自然语言处理领域中最常见的任务之一。国内外学者在句子情感分类任务中,利用深度学习神经网络进行了大量的实验,证明其能够更有效地获取文本数据中的上下文信息。目前,应用于处理句子情感分类任务的神经网络模型通常包括卷积神经网络、递归神经网络和循环神经网络。随着深度学习的发展,神经网络与注意力结合的架构方式为句子情感分类任务的发展带来了重大的突破,预
光学字符识别(Optical Character Recognition,OCR)作为计算机视觉领域中的重要分支,在自然场景与特定场景中都具有广泛的应用空间与研究价值。传统的字符识别方法在对于文档等简单背景的字符识别任务中已经取得了较大的成功,但对于较为复杂的特定场景中的符识别难免捉襟见肘。近年来随着卷积神经网络研究的不断深入,因其能轻易地提取数据间深层的特征关系,极大地提高了对于图像数据的处理效
语言作为人际交流的必要途径,除了具有传递信息的功能之外,还有表达情绪的动能。同样的话语在不同的情感背景下往往表达不同的意义,全球语言皆是如此。因此语音情感识别具有重要的研究价值。在人工智能情感计算领域,语音信号是最基本、最重要的模态之一。国内外众多学者针对语音情感的研究大多分为语音信号直接处理识别以及转换为谱图进行处理识别。而且语音情感识别任务,可以引申出的多个应用领域,比如:智能助老机器人,办公