论文部分内容阅读
摘 要:深度学习技术属于AI领域的一个分支,它在语音识别以及计算机视觉等方面都具有十分飞速的发展,特别是高新技术的快速发展,人工智能领域也得到了有效的推动,图像识别技术作为人工智能领域的重要课题,包括分类识别和特征提取两大模块,同时深度学习广泛应用在图像识别、语音识别等众多领域。笔者就深度学习在图像识别中的应用进行深入分析,主要从人脸识别、遥感图像分类等诸多方面进行阐述,其目的是为相关从业人员提供帮助,以此来推动人工智能发展大潮中图像识别领域的发展。
关键词:深度学习;图像识别;应用
引言
深度学习的方式能够帮助人们对数据表述展开多层次的分析,在深度学习方式中,将重点放在问题中,确定其中的特征向量,再采用训练和抽取的方式实现数据处理,例如在僵尸网络中,要想对其进行全面、有效的识别,就需要利用其相关特征建立模型。在该种方式中,需要先确定特征质量,其直接决定着最终学习结果的开展效率,通常需要采用语义呈现相互交叉的向量展开研究,采用该方式能够提高整个计算过程的维度,并且避免出现实际效能增加的现象,此过程可以利用主成分分析法和深度学习算法的方式实现。
一、人工智能和深度学习的基本概念
所谓人工智能,主要是进行模拟、延伸以及扩展人的智能的一门技术学科。总的来说,AI技术可以在很大程度上提高实际工作效率,并且替代相对比较简单的人工劳动。最新一代的人工智能主要是以机器学习以及大数据学习作为主要代表的。机器学习是一种相对比较高性能的人工智能技术,主要依靠的是计算机的高性能储存能力以及运算能力,可以将大数据作为主要依据,进行有关高效率以及高准确率的相关算法的学习。
所谓深度学习,从本质上来说,是一个相对比较复杂的机器学习算法。它在图像识别以及语言识别等方面的效果十分显著,要远远的超过以往的各种技术。另外,它在数据挖掘、机器学习以及搜索技术等方面也取得了相对比较可观的成绩。深度学习的相关技术,可以使机器来对人的各种活动进行精准模仿,以此来解决许多相对比较复杂以及难懂的问题。因此,深度学习现如今已经逐渐实现了许多机器学习方面的实际应用。
深度学习是基于大数据的自主学习过程,并非通过手工设计来获得相关数据,即是通过组合低层来获得更加直观的表示方式,从而实现机器能够代替人类学习,其最终的目的是实现模拟人脑来进行一系列的学习活动,相当于机器模仿人类的一切学习活动。由于深度学习从大数据自主学习可以获得良好的特征,因而可以起到提高图像识别系统性能的作用。
二、深度学习在图像识别中的应用
(一)人脸识别
深度学习在图像识别中应用最多的就是人脸识别,而人脸识别最大的挑战是如何将诸多因素引发的变化区分开来。能够引发图像识别变化的因素有很多,比如光线、表情、身份等诸多因素,由这些因素产生的变化在分布的性质上往往属于非线性,同时这些变化也存在着极为复杂且多变的特征,所以很多时候借助传统线性模型难以将其区分开来。而深度学习之所以被广泛应用于人脸识别,其最终目的就是为了实现多层非线性的变换,因为通过多层的非线性变换就能获取新的特征, 进而有效区分由诸多因素引起的相关变化。
(二)遥感图像
遥感图像中包含着大量的数据信息,这些具有价值意义的数据被广泛应用于各行各业。遥感图像数据具有两大特征,一是由过于庞大的图像数据所导致的信息冗余,二是由较低的图像分辨率所导致的不同信息间的相互融合。因此,对遥感图像分类较为困难,传统的遥感图像分类方法难以将有价值的信息准确分离出来。如果将深度学习技术应用于遥感图像分类中,通过建立合适的深度学习模型,同时结合使用特定的优化算法,则可以取得很好的分类效果,这已成为当前遥感图像分类技术的发展趋势。
(三)交通图像
交通图像识别技术通常被应用于汽车的车牌识别、车道偏离预警以及交通标识等诸多方面,为人们的日常出行提供了许多便利。同时交通图像识别技术还被大量应用于智能停车、收费管理、交通控制等方面。近年来,相关研究人员尝试将深度学习技术运用到更深层次的交通图像识别领域中,比如,将深度卷积神经网络应用于交通标志检测领域,可以得到具有较强时效性和较高精确度的交通标志检测算法。基于深度学习的交通图像识别技术,为交通图像识别领域的探索与创新提供了新的方法。
(四)字符图像识别
字符图像识别在邮政信件、电子签名和支票等诸多领域被广泛使用,也取得了较好的效果。但是早些年的字符图像识别技术弊端在于,严重依赖人工对字符的预处理,显然这样的识别可靠性和识别效率较低。深度学习技术兴起以后,一些研究人员开始利用深度学习技术来研究字符图像识别,获得了不错的成绩和效果,将字符图像识别的错误率明显降低,使得机器与人类观察者之间的差距越来越小。
(五)视频图像分析
在深度学习中如何描述视频的动态特征是一个难点,因为在传统的视觉研究方法中,往往是通过光流估计、动态纹理等进行动态特征的描述,然而深度模型却难以体现出这些动态特征的描述信息。解决此问题有三个方向:第一个方向是将视频图像视为三维图像,并直接将其应用于卷积网络中,但是该方向的问题在于没有考虑到空间维和时间维的差异性;第二个方向是进行预处理,计算光流场或其他动态特征的空间场分布,并以之作为卷积网络的一个输入通道;第三个方向是通过长短时记忆网络捕捉长期依赖性,从而实现对视频图像中复杂动态的有效建模。
结束语:
综上所述,深度学习如今已经被广泛应用于各行各业,也取得了令人瞩目的成绩和效果,尤其是在图像识别领域中的应用更是效果显著。深度学习主要是指学习样本的内在规律以及表示层次,而它最终的目标主要是为了让机器能够像人一样具有分析和学习的能力,能够精准地对文字、图像和声音等数据进行识别,同时深度学习还是一个相对复杂的机器学习算法。
参考文献:
[1]李卫.深度学习在图像识别中的研究及应用[D].武汉理工大学.
[2]周宇杰.深度学习在图像识别领域的应用现状与优势[J].中国安防(7期):75-78.
[3]郑远攀,李广阳,李晔.深度学习在图像识别中的应用研究综述[J].计算机工程与应用,2019,055(012):20-36.
作者簡介:
高宇(1994-),男,汉族,中国联合网络通信有限公司郑州市分公司,郑州大学研究生在读,研究方向:深度学习。
关键词:深度学习;图像识别;应用
引言
深度学习的方式能够帮助人们对数据表述展开多层次的分析,在深度学习方式中,将重点放在问题中,确定其中的特征向量,再采用训练和抽取的方式实现数据处理,例如在僵尸网络中,要想对其进行全面、有效的识别,就需要利用其相关特征建立模型。在该种方式中,需要先确定特征质量,其直接决定着最终学习结果的开展效率,通常需要采用语义呈现相互交叉的向量展开研究,采用该方式能够提高整个计算过程的维度,并且避免出现实际效能增加的现象,此过程可以利用主成分分析法和深度学习算法的方式实现。
一、人工智能和深度学习的基本概念
所谓人工智能,主要是进行模拟、延伸以及扩展人的智能的一门技术学科。总的来说,AI技术可以在很大程度上提高实际工作效率,并且替代相对比较简单的人工劳动。最新一代的人工智能主要是以机器学习以及大数据学习作为主要代表的。机器学习是一种相对比较高性能的人工智能技术,主要依靠的是计算机的高性能储存能力以及运算能力,可以将大数据作为主要依据,进行有关高效率以及高准确率的相关算法的学习。
所谓深度学习,从本质上来说,是一个相对比较复杂的机器学习算法。它在图像识别以及语言识别等方面的效果十分显著,要远远的超过以往的各种技术。另外,它在数据挖掘、机器学习以及搜索技术等方面也取得了相对比较可观的成绩。深度学习的相关技术,可以使机器来对人的各种活动进行精准模仿,以此来解决许多相对比较复杂以及难懂的问题。因此,深度学习现如今已经逐渐实现了许多机器学习方面的实际应用。
深度学习是基于大数据的自主学习过程,并非通过手工设计来获得相关数据,即是通过组合低层来获得更加直观的表示方式,从而实现机器能够代替人类学习,其最终的目的是实现模拟人脑来进行一系列的学习活动,相当于机器模仿人类的一切学习活动。由于深度学习从大数据自主学习可以获得良好的特征,因而可以起到提高图像识别系统性能的作用。
二、深度学习在图像识别中的应用
(一)人脸识别
深度学习在图像识别中应用最多的就是人脸识别,而人脸识别最大的挑战是如何将诸多因素引发的变化区分开来。能够引发图像识别变化的因素有很多,比如光线、表情、身份等诸多因素,由这些因素产生的变化在分布的性质上往往属于非线性,同时这些变化也存在着极为复杂且多变的特征,所以很多时候借助传统线性模型难以将其区分开来。而深度学习之所以被广泛应用于人脸识别,其最终目的就是为了实现多层非线性的变换,因为通过多层的非线性变换就能获取新的特征, 进而有效区分由诸多因素引起的相关变化。
(二)遥感图像
遥感图像中包含着大量的数据信息,这些具有价值意义的数据被广泛应用于各行各业。遥感图像数据具有两大特征,一是由过于庞大的图像数据所导致的信息冗余,二是由较低的图像分辨率所导致的不同信息间的相互融合。因此,对遥感图像分类较为困难,传统的遥感图像分类方法难以将有价值的信息准确分离出来。如果将深度学习技术应用于遥感图像分类中,通过建立合适的深度学习模型,同时结合使用特定的优化算法,则可以取得很好的分类效果,这已成为当前遥感图像分类技术的发展趋势。
(三)交通图像
交通图像识别技术通常被应用于汽车的车牌识别、车道偏离预警以及交通标识等诸多方面,为人们的日常出行提供了许多便利。同时交通图像识别技术还被大量应用于智能停车、收费管理、交通控制等方面。近年来,相关研究人员尝试将深度学习技术运用到更深层次的交通图像识别领域中,比如,将深度卷积神经网络应用于交通标志检测领域,可以得到具有较强时效性和较高精确度的交通标志检测算法。基于深度学习的交通图像识别技术,为交通图像识别领域的探索与创新提供了新的方法。
(四)字符图像识别
字符图像识别在邮政信件、电子签名和支票等诸多领域被广泛使用,也取得了较好的效果。但是早些年的字符图像识别技术弊端在于,严重依赖人工对字符的预处理,显然这样的识别可靠性和识别效率较低。深度学习技术兴起以后,一些研究人员开始利用深度学习技术来研究字符图像识别,获得了不错的成绩和效果,将字符图像识别的错误率明显降低,使得机器与人类观察者之间的差距越来越小。
(五)视频图像分析
在深度学习中如何描述视频的动态特征是一个难点,因为在传统的视觉研究方法中,往往是通过光流估计、动态纹理等进行动态特征的描述,然而深度模型却难以体现出这些动态特征的描述信息。解决此问题有三个方向:第一个方向是将视频图像视为三维图像,并直接将其应用于卷积网络中,但是该方向的问题在于没有考虑到空间维和时间维的差异性;第二个方向是进行预处理,计算光流场或其他动态特征的空间场分布,并以之作为卷积网络的一个输入通道;第三个方向是通过长短时记忆网络捕捉长期依赖性,从而实现对视频图像中复杂动态的有效建模。
结束语:
综上所述,深度学习如今已经被广泛应用于各行各业,也取得了令人瞩目的成绩和效果,尤其是在图像识别领域中的应用更是效果显著。深度学习主要是指学习样本的内在规律以及表示层次,而它最终的目标主要是为了让机器能够像人一样具有分析和学习的能力,能够精准地对文字、图像和声音等数据进行识别,同时深度学习还是一个相对复杂的机器学习算法。
参考文献:
[1]李卫.深度学习在图像识别中的研究及应用[D].武汉理工大学.
[2]周宇杰.深度学习在图像识别领域的应用现状与优势[J].中国安防(7期):75-78.
[3]郑远攀,李广阳,李晔.深度学习在图像识别中的应用研究综述[J].计算机工程与应用,2019,055(012):20-36.
作者簡介:
高宇(1994-),男,汉族,中国联合网络通信有限公司郑州市分公司,郑州大学研究生在读,研究方向:深度学习。