论文部分内容阅读
摘要:随着社会经济的发展,科学技术发展迅猛,特别是在计算机领域先进技术层出不穷,极大地促进了社会的发展,便捷了人们的日常生活。深度学习是计算机学习和研究中的一个新领域,可以通过对人类大脑的模仿释放相关数据。本文探究深度学习在计算机视觉领域的应用进展研究,希望能够促进计算机视觉领域的发展。
摘要:深度学习;计算机视觉领域;应用;进展
一、前言
在当前社会中,由于社会发展的需要,计算机视觉成为社会生产生活的重要组成部分。所谓计算机视觉,就是指通过摄影机和计算机代替我们人类的眼睛对目标进行识别、跟踪和测量,并能够将所得数据进行图形处理,最后把它变成更适合人类观察的图像,或者适合仪器检查的图像。对于图像的处理包括图像分类、图像匹配、目标检测、图像问答、图像语义分割、行为识别等。图像语义分割和图像问答是近年来计算机技术发展的重点方向,需要用到深度学习的技术。深度学习技术对于计算机视觉领域的发展起到了重要的作用。
二、深度学习算法在图像分类中的应用
通过在深度学习中建立卷积神经网络模型,计算机视觉系统有了大的突破,其中应用最广的是图像分类和物体检测。
图像分类就是通过对图像进行分析,能够把图像划分到某种类别中。图像分类强调图像整体语义的判定。当前最常用语评判此类算法的带标签数据集就是ImageNet和CIFAR-10/100。ImageNet的规模比较大,种类也比较多,在迁移学习的思想运用比较多。迁移学习的通用场景为:在普通的场景下训练深度模型,通过将它的网络结构和参数与小数据集进行共享的任务场景,这样深度模型上的小数据任务就可以进行微调。除此之外,图像分类领域既是计算机视觉领域的基础领域,也是最早使用深度学习的领域。计算机视觉领域的其他领域也可以在借鉴分类任务经验的基础上,把模型迁移到其他任务之上,这也是计算机视觉领域的发展趋势。
三、深度学习在物体检测中的应用
将物体检测与图像分类进行对比会发现,物体检测任务更加复杂。物体检测就是指在给出的一张图像中(图像中包含了多个不同类别的物体),可以对每个物体进行识别和定位。可以说,想要在物体检测中获得好的效果是比较难以实现的,深度学习模型在物体检测中也更加复杂。
当前的计算机视觉领域中,物体检测模型的建立基础是卷积神经网络。基本上所有的物体检测中的困难都集中在如何提取候选区域和如何对候选区域进行分类这两个问题上。这也就是物体检测问题比图像分类问题的难度更高、更加复杂的原因。同时物体检测问题对于模型的性能要求也比较高。近些年来,随着科学技术的发展,卷积神经网络算法在结构方面也有了较大的突破和技术创新,促进了物体检测技术的发展。卷积神经网络的应用范围不限于图像分类和物体检测,在计算机视觉领域的其他方面也有着重要的作用。卷积神经网络中的“端到端”技术,能够使用可以更加方便。同时,卷积神经网络可以在增多神经元和加深网络层次的情况下将训练网络进行优化,使得卷积神经网络可以适用于结构抽取型和数据稠密型的任务。
四、深度学习在人脸识别系统中的应用
留心观察周围的生活我们不难发现,人脸识别技术在多个行业中都有了应用。通过人脸识别技术,可以便于企业的员工考勤、优化客户的使用体验、提高服务水平等。如在防盗门上安装人脸识别技术,便可以防盗。在企業安装人脸识别技术,可以提高员工的工作积极性。
人脸识别技术主要分为两类:人脸特征提取识别和人脸检测定位。人脸检测定位要求能够从所取的图像中分割出人脸目标,然后进行归一化处理。人脸特征提取识别时要求算法具有不变形。人脸特征提取识别中的技术难点在于人脸不是一成不变的,而是具有一定弹性和可变性,建模难度高。人脸检测定位中的技术难点在于人脸目标模式的多样性和背景的复杂性。未来人脸检测定位的技术要能够简化复杂的背景,还要建立高维空间人脸建模。
五、计算机视觉领域的商用和创新应用
计算机视觉技术在商业中的应用越来越广泛。主要应用范围为安全监控、犯罪体态识别、人脸识别、电子商务以及户籍管理等许多方面。计算机视觉技术对于社会的经济、安全、发展起到了积极的作用。如通过犯罪体态识别,可以帮助刑警将犯罪嫌疑人尽快捉拿归案,保障人民群众的人身和财产安全。企业通过使用人脸识别技术,可以防止替班、迟到、早退等不良现象出现,便于提高企业生产效率,促进企业发展。
现在计算机视觉技术在许多其他领域也有了新的应用。在工业生产中,通过图像处理和物体检测技术,工业生产中的某些相关任务的准确率和效率有了提升。在农业生产领域,对水果进行分级时往往采用人工分级。但是在实际人工分级时,操作难度比较大。这是因为果蔬都是自然产品,在外观的有着较大的差异。计算机视觉技术的应用,可以让果蔬实现自动分级。通过相关技术设置,可以根据果蔬的大小、颜色、形状、表面损伤和光滑程度进行分级。
六、深度学习在计算机视觉领域的发展
虽然计算机视觉领域已经有了较大的发展和进步,但是还有较大的进步空间。在计算机算法方面,最近的研究报告指出将计算机视觉系统收集到的时序信息与CNN抽到的结构信息结合后能够取得更好的效果,那么未来科研人员可以把此作为新的研究方向。另外,计算机视觉领域中的图像问答和图像摘要在近几年的科研中有了新的突破,这都是计算机视觉技术与自然语言处理互相结合的结果。未来几年,科研人员一定能有更大的研究发现和研究成果。最后,通过对网络提取中的特征表示进行升级和改造,计算机在人工智能的应用范围会更广。
七、结束语
随着科研人员的不懈努力,深度学习技术在近些年取得了不俗的发展和进步。文中提到的图像分析、物体检测以及人脸识别系统在技术方面已经成熟,在社会生产和生活中的应用也已经十分广泛。对于图像分割、图像问答、图像识别等领域也在不断地发展进步中。相信在科研人员和全社会的共同努力下,计算机视觉领域会有更好的发展。
参考文献
[1]张忠宝.关于人脸识别技术在商业银行方面的应用——基于计算机视觉 [J]. 计算机光盘软件与应用,2012,15(20):61-62.
[2] 李东. 计算机视觉技术在工业领域中的应用 [J]. 电子技术与软件工程,2017,(16):147.
[3]张瑞宇,刘顺淑.计算机视觉技术在果蔬采后处理中的应用[J].重庆工商大学学报(自然科学版)[J],2004,(05)
[4] 陈鸿翔. 基于卷积神经网络的图像语义分割 [D]. 浙江大学,2016.
[5] 周益淇.深度学习在计算机视觉领域的应用进展 [J].电子制作,2018(08).
(作者单位:北京信息科技大学机电工程学院)
摘要:深度学习;计算机视觉领域;应用;进展
一、前言
在当前社会中,由于社会发展的需要,计算机视觉成为社会生产生活的重要组成部分。所谓计算机视觉,就是指通过摄影机和计算机代替我们人类的眼睛对目标进行识别、跟踪和测量,并能够将所得数据进行图形处理,最后把它变成更适合人类观察的图像,或者适合仪器检查的图像。对于图像的处理包括图像分类、图像匹配、目标检测、图像问答、图像语义分割、行为识别等。图像语义分割和图像问答是近年来计算机技术发展的重点方向,需要用到深度学习的技术。深度学习技术对于计算机视觉领域的发展起到了重要的作用。
二、深度学习算法在图像分类中的应用
通过在深度学习中建立卷积神经网络模型,计算机视觉系统有了大的突破,其中应用最广的是图像分类和物体检测。
图像分类就是通过对图像进行分析,能够把图像划分到某种类别中。图像分类强调图像整体语义的判定。当前最常用语评判此类算法的带标签数据集就是ImageNet和CIFAR-10/100。ImageNet的规模比较大,种类也比较多,在迁移学习的思想运用比较多。迁移学习的通用场景为:在普通的场景下训练深度模型,通过将它的网络结构和参数与小数据集进行共享的任务场景,这样深度模型上的小数据任务就可以进行微调。除此之外,图像分类领域既是计算机视觉领域的基础领域,也是最早使用深度学习的领域。计算机视觉领域的其他领域也可以在借鉴分类任务经验的基础上,把模型迁移到其他任务之上,这也是计算机视觉领域的发展趋势。
三、深度学习在物体检测中的应用
将物体检测与图像分类进行对比会发现,物体检测任务更加复杂。物体检测就是指在给出的一张图像中(图像中包含了多个不同类别的物体),可以对每个物体进行识别和定位。可以说,想要在物体检测中获得好的效果是比较难以实现的,深度学习模型在物体检测中也更加复杂。
当前的计算机视觉领域中,物体检测模型的建立基础是卷积神经网络。基本上所有的物体检测中的困难都集中在如何提取候选区域和如何对候选区域进行分类这两个问题上。这也就是物体检测问题比图像分类问题的难度更高、更加复杂的原因。同时物体检测问题对于模型的性能要求也比较高。近些年来,随着科学技术的发展,卷积神经网络算法在结构方面也有了较大的突破和技术创新,促进了物体检测技术的发展。卷积神经网络的应用范围不限于图像分类和物体检测,在计算机视觉领域的其他方面也有着重要的作用。卷积神经网络中的“端到端”技术,能够使用可以更加方便。同时,卷积神经网络可以在增多神经元和加深网络层次的情况下将训练网络进行优化,使得卷积神经网络可以适用于结构抽取型和数据稠密型的任务。
四、深度学习在人脸识别系统中的应用
留心观察周围的生活我们不难发现,人脸识别技术在多个行业中都有了应用。通过人脸识别技术,可以便于企业的员工考勤、优化客户的使用体验、提高服务水平等。如在防盗门上安装人脸识别技术,便可以防盗。在企業安装人脸识别技术,可以提高员工的工作积极性。
人脸识别技术主要分为两类:人脸特征提取识别和人脸检测定位。人脸检测定位要求能够从所取的图像中分割出人脸目标,然后进行归一化处理。人脸特征提取识别时要求算法具有不变形。人脸特征提取识别中的技术难点在于人脸不是一成不变的,而是具有一定弹性和可变性,建模难度高。人脸检测定位中的技术难点在于人脸目标模式的多样性和背景的复杂性。未来人脸检测定位的技术要能够简化复杂的背景,还要建立高维空间人脸建模。
五、计算机视觉领域的商用和创新应用
计算机视觉技术在商业中的应用越来越广泛。主要应用范围为安全监控、犯罪体态识别、人脸识别、电子商务以及户籍管理等许多方面。计算机视觉技术对于社会的经济、安全、发展起到了积极的作用。如通过犯罪体态识别,可以帮助刑警将犯罪嫌疑人尽快捉拿归案,保障人民群众的人身和财产安全。企业通过使用人脸识别技术,可以防止替班、迟到、早退等不良现象出现,便于提高企业生产效率,促进企业发展。
现在计算机视觉技术在许多其他领域也有了新的应用。在工业生产中,通过图像处理和物体检测技术,工业生产中的某些相关任务的准确率和效率有了提升。在农业生产领域,对水果进行分级时往往采用人工分级。但是在实际人工分级时,操作难度比较大。这是因为果蔬都是自然产品,在外观的有着较大的差异。计算机视觉技术的应用,可以让果蔬实现自动分级。通过相关技术设置,可以根据果蔬的大小、颜色、形状、表面损伤和光滑程度进行分级。
六、深度学习在计算机视觉领域的发展
虽然计算机视觉领域已经有了较大的发展和进步,但是还有较大的进步空间。在计算机算法方面,最近的研究报告指出将计算机视觉系统收集到的时序信息与CNN抽到的结构信息结合后能够取得更好的效果,那么未来科研人员可以把此作为新的研究方向。另外,计算机视觉领域中的图像问答和图像摘要在近几年的科研中有了新的突破,这都是计算机视觉技术与自然语言处理互相结合的结果。未来几年,科研人员一定能有更大的研究发现和研究成果。最后,通过对网络提取中的特征表示进行升级和改造,计算机在人工智能的应用范围会更广。
七、结束语
随着科研人员的不懈努力,深度学习技术在近些年取得了不俗的发展和进步。文中提到的图像分析、物体检测以及人脸识别系统在技术方面已经成熟,在社会生产和生活中的应用也已经十分广泛。对于图像分割、图像问答、图像识别等领域也在不断地发展进步中。相信在科研人员和全社会的共同努力下,计算机视觉领域会有更好的发展。
参考文献
[1]张忠宝.关于人脸识别技术在商业银行方面的应用——基于计算机视觉 [J]. 计算机光盘软件与应用,2012,15(20):61-62.
[2] 李东. 计算机视觉技术在工业领域中的应用 [J]. 电子技术与软件工程,2017,(16):147.
[3]张瑞宇,刘顺淑.计算机视觉技术在果蔬采后处理中的应用[J].重庆工商大学学报(自然科学版)[J],2004,(05)
[4] 陈鸿翔. 基于卷积神经网络的图像语义分割 [D]. 浙江大学,2016.
[5] 周益淇.深度学习在计算机视觉领域的应用进展 [J].电子制作,2018(08).
(作者单位:北京信息科技大学机电工程学院)