论文部分内容阅读
【摘 要】人類正处在信息化的时代,计算机的应用也随着时代的变迁几乎进入所有领域。计算机视觉是人工智能的一个重要分支领域,它在人工智能中扮演着越来越重要的作用,对现如今人们的生活和认识世界的方式有着越来越重要的作用。随着深度学习,尤其是卷积神经网络的出现,使计算机视觉在各个领域发挥了重要作用。本文主要介绍关于计算机视觉技术以及在各个行业的应用。
【关键词】深度学习;卷积神经网络;计算机视觉
现代科学研究表明,人类的学习和认识活动中,至少80%以上都是通过视觉完成的。也就是说,视觉感知是人类理解和认识世界的主要手段。视觉对人类如此重要,对于计算机的研究当然也不能少了视觉相关领域,即计算机视觉。
一、计算机视觉概述
计算机视觉研究对象之一是如何利用二维投影图像恢复三维景物世界,其基本目的可以归结为从单幅或多福二维投影图像(或视频序列)计算出观察点和目标对象之间的空间位置关系及目标对象的物理属性。从人工智能诞生之日起,视觉相关的应用就一直是该领域内科学家偏爱的方向。深度学习始于神经网络,神经网络始于感知机。感知机是1957年由FrankRosenblat提出的,感知机事实上就是人工神经网络的最小单元,这个结构里有最两个基本的成分:计算输入向量的线性变化;对线性组合的结果进行阈值判断,实际上就是非线性变换。或者更简单来说把阈值和线性变换放一起,则是仿射变换,所以感知机本质上就是一个仿射变换接一个非线性变换。而神经网络其实就是一种模仿生物神经的连接模型,运行分布式并行信息处理的算法数学模型。这种网络内部十分复杂,也正是依靠着这些复杂,通过调整内部节点相互连接的关系,从而达到处理信息的目的,神经网络的出现无疑于给机器算法奠定了基础。而伴随着各种机器学习算法的全面开花,机器学习开始成为计算机视觉,尤其是识别、检测和分类等应用中的一个不可分割的重要工具。计算机视觉应用也成为了我们日常生活中不可缺少的伴侣。
二、计算机视觉与卷积神经网络
计算机视觉技术是使计算机模拟人类的视觉过程,具有感受环境的能力和人类视觉功能的技术,是一门综合性较强的技术,设计的学科和技术非常广泛。主要包括图像处理、人工智能、模式识别、计算机科学、物理学、生物学和心理学等学科的综合。
和计算机视觉最紧密联系的就是卷积神经网络。但其实卷积神经网络也是受到了人类视觉神经系统的启发。人类神经系统是一个非常复杂的系统,至今还没有比完全的理解,而且大多数的人类视觉系统视觉特性不是凭直觉获知的。人类视觉系统是人们理解和认知自然世界的关键工具。所以我们先来简单了解一下视觉神经系统。眼睛是一个成像系统,图像通过瞳孔、晶状体最终在视网膜上成像,这一部分是视觉的光学系统。视网膜上布满了大量的光感受细胞,可以把光刺激转换成神经冲动,然后进入视觉神经系统传递进大脑的初级视觉皮层。从视觉皮层开始对图像信息分层,这些层从v1~v5,每一层处理特定的信息。而在1958年对猫视觉皮层的研究发现了简单细胞和复杂细胞,这两种细胞的特点就是每个细胞质只对特定方向的条形图样有刺激反应,也就是说这种细胞是有方向选择性的,两者区别则是,简单细胞对应的视网膜的光感受细胞所在区域很小,而复杂细胞相对大,这个区域被称为感受野。简单来说卷积层用来模拟对特定图案的响应,而池化层模拟感受野。卷积神经网络对计算机视觉的应用非常广泛,比如图像的分类、物体检测、人脸识别、图像搜索、图像分割等。
三、计算机视觉的应用
计算机视觉的相关技术给计算机带来了更多广泛的应用,拥有“视觉”的智能计机不但使计算机更便于为人们所使用,同时如果用这样的计算机来控制各种自动化装置特别是智能机器人就可以是这些自动化装置和机器人具有使用环境和自主决策的能力。下面来介绍关于计算机视觉的应用。
安防。安防是最早应用于计算机视觉的领域之一。人脸识别和指纹识别在许多国家都有应用,常见的应用有利用人脸库和公共摄像头对犯罪嫌疑人进行识别和布控。如利用公共摄像头捕捉到的画面,在其中查找可能出现的犯罪嫌疑人,用超分辨率技术对图像进行修复,并自动或辅助人工进行识别以追踪犯罪嫌疑人的踪迹。移动监测也是计算机视觉在安防中的重要应用,利用摄像头监控画面移动用于防盗和监控监狱。
交通。比如利用计算机视觉技术对违章车辆的照片进行分析提取车牌号码并登记在案。这是大家都熟知的一项应用。此外很多停车场和收费站也用到车牌识别。除了车牌识别,还有利用摄像头分析交通拥堵状况或者隧道桥梁监控等技术。
工业生产。工业生产也是最早应用于计算机视觉领域之一。如利用摄像头拍摄的图片对长度进行非精密测量。利用识别技术识别工业部件上的缺陷和划痕等。
在线购物。事实上计算机视觉在电商领域的应用也非常多。比如当我们一打开购物时,我们最先看到的一定是图片,而为了看到这些精美的图片,电商背后的计算机视觉就成了非常重要的技术。还有我们熟知的扫描照片提取相似宝贝,也用了图像识别技术。
医疗。医学影像是医疗领域中一个非常活跃的研究方向,各种影像和视觉技术在这个领域中至关重要。计算机断层成像,核磁共振成像中重建三维图像,并进行一些三维表面渲染都有涉及一些计算机视觉的基础手段。细胞识别和肿瘤识别用于辅助诊断,一些细胞或者体液中小型颗粒物的识别,还可以用来量化分析血液或其它体液中的指标。
当然计算机视觉的应用不止于此,也远不止于此。在未来它还会开拓出更多、更广、更深层次的应用。
四、计算机视觉未来发展趋势
计算机视觉在人工智能里面可以类比于人类的眼睛,是在感知层上最为重要的核心技术之一。它在各个行业都有或多或少的应用,涉及的技术、学科都非常的广泛。随着5G时代的到来,将会推动医疗、自动驾驶发挥发展,同时会加大推动计算机视觉在这些行业的应用,例如医疗影像识别、自动驾驶中的影响识别等等。随着算法的更迭、硬件升级、大数据的爆发,计算机视觉也将会有更大的想象空间。
【参考文献】
[1] (美)萨利斯基著.艾海舟,兴军亮等译.计算机视觉—算法与应用[M].北京:清华大学出版社,2012.
[2] 张波.数字图像处理技术的发展与应用[J].品牌 :理论月刊,2011(Z2):158-158.
[3] 甄栋志,朱永伟,苏楠等.基于计算机视觉对目标识别检测的研究[J].机械工程与自动化,2014(1):129-130.
[4]杨雪.基于纹理基元快的图像语义分割[D].西南科技大学,2015.
[5]吴 璟 莉,刘 袁 静.一种基于颜色拮抗感受野的轮廓检测模型[J].计 算 机 科 学,2016,43(7):319-323.
[6]160-183.姜枫,顾庆,郝慧珍.基于内容的图像分割方法综述[J].软件学报,2017,28(1):160-183.
[7]王嫣然,陈清亮,吴俊君.面向复杂环境的图像语义分割方法综述[J].计算机科学,2019,46(9):36-46.[3]KRIZHEVSKY A,SUTSKEVER I,HINTON G.ImageNet classifica.
【关键词】深度学习;卷积神经网络;计算机视觉
现代科学研究表明,人类的学习和认识活动中,至少80%以上都是通过视觉完成的。也就是说,视觉感知是人类理解和认识世界的主要手段。视觉对人类如此重要,对于计算机的研究当然也不能少了视觉相关领域,即计算机视觉。
一、计算机视觉概述
计算机视觉研究对象之一是如何利用二维投影图像恢复三维景物世界,其基本目的可以归结为从单幅或多福二维投影图像(或视频序列)计算出观察点和目标对象之间的空间位置关系及目标对象的物理属性。从人工智能诞生之日起,视觉相关的应用就一直是该领域内科学家偏爱的方向。深度学习始于神经网络,神经网络始于感知机。感知机是1957年由FrankRosenblat提出的,感知机事实上就是人工神经网络的最小单元,这个结构里有最两个基本的成分:计算输入向量的线性变化;对线性组合的结果进行阈值判断,实际上就是非线性变换。或者更简单来说把阈值和线性变换放一起,则是仿射变换,所以感知机本质上就是一个仿射变换接一个非线性变换。而神经网络其实就是一种模仿生物神经的连接模型,运行分布式并行信息处理的算法数学模型。这种网络内部十分复杂,也正是依靠着这些复杂,通过调整内部节点相互连接的关系,从而达到处理信息的目的,神经网络的出现无疑于给机器算法奠定了基础。而伴随着各种机器学习算法的全面开花,机器学习开始成为计算机视觉,尤其是识别、检测和分类等应用中的一个不可分割的重要工具。计算机视觉应用也成为了我们日常生活中不可缺少的伴侣。
二、计算机视觉与卷积神经网络
计算机视觉技术是使计算机模拟人类的视觉过程,具有感受环境的能力和人类视觉功能的技术,是一门综合性较强的技术,设计的学科和技术非常广泛。主要包括图像处理、人工智能、模式识别、计算机科学、物理学、生物学和心理学等学科的综合。
和计算机视觉最紧密联系的就是卷积神经网络。但其实卷积神经网络也是受到了人类视觉神经系统的启发。人类神经系统是一个非常复杂的系统,至今还没有比完全的理解,而且大多数的人类视觉系统视觉特性不是凭直觉获知的。人类视觉系统是人们理解和认知自然世界的关键工具。所以我们先来简单了解一下视觉神经系统。眼睛是一个成像系统,图像通过瞳孔、晶状体最终在视网膜上成像,这一部分是视觉的光学系统。视网膜上布满了大量的光感受细胞,可以把光刺激转换成神经冲动,然后进入视觉神经系统传递进大脑的初级视觉皮层。从视觉皮层开始对图像信息分层,这些层从v1~v5,每一层处理特定的信息。而在1958年对猫视觉皮层的研究发现了简单细胞和复杂细胞,这两种细胞的特点就是每个细胞质只对特定方向的条形图样有刺激反应,也就是说这种细胞是有方向选择性的,两者区别则是,简单细胞对应的视网膜的光感受细胞所在区域很小,而复杂细胞相对大,这个区域被称为感受野。简单来说卷积层用来模拟对特定图案的响应,而池化层模拟感受野。卷积神经网络对计算机视觉的应用非常广泛,比如图像的分类、物体检测、人脸识别、图像搜索、图像分割等。
三、计算机视觉的应用
计算机视觉的相关技术给计算机带来了更多广泛的应用,拥有“视觉”的智能计机不但使计算机更便于为人们所使用,同时如果用这样的计算机来控制各种自动化装置特别是智能机器人就可以是这些自动化装置和机器人具有使用环境和自主决策的能力。下面来介绍关于计算机视觉的应用。
安防。安防是最早应用于计算机视觉的领域之一。人脸识别和指纹识别在许多国家都有应用,常见的应用有利用人脸库和公共摄像头对犯罪嫌疑人进行识别和布控。如利用公共摄像头捕捉到的画面,在其中查找可能出现的犯罪嫌疑人,用超分辨率技术对图像进行修复,并自动或辅助人工进行识别以追踪犯罪嫌疑人的踪迹。移动监测也是计算机视觉在安防中的重要应用,利用摄像头监控画面移动用于防盗和监控监狱。
交通。比如利用计算机视觉技术对违章车辆的照片进行分析提取车牌号码并登记在案。这是大家都熟知的一项应用。此外很多停车场和收费站也用到车牌识别。除了车牌识别,还有利用摄像头分析交通拥堵状况或者隧道桥梁监控等技术。
工业生产。工业生产也是最早应用于计算机视觉领域之一。如利用摄像头拍摄的图片对长度进行非精密测量。利用识别技术识别工业部件上的缺陷和划痕等。
在线购物。事实上计算机视觉在电商领域的应用也非常多。比如当我们一打开购物时,我们最先看到的一定是图片,而为了看到这些精美的图片,电商背后的计算机视觉就成了非常重要的技术。还有我们熟知的扫描照片提取相似宝贝,也用了图像识别技术。
医疗。医学影像是医疗领域中一个非常活跃的研究方向,各种影像和视觉技术在这个领域中至关重要。计算机断层成像,核磁共振成像中重建三维图像,并进行一些三维表面渲染都有涉及一些计算机视觉的基础手段。细胞识别和肿瘤识别用于辅助诊断,一些细胞或者体液中小型颗粒物的识别,还可以用来量化分析血液或其它体液中的指标。
当然计算机视觉的应用不止于此,也远不止于此。在未来它还会开拓出更多、更广、更深层次的应用。
四、计算机视觉未来发展趋势
计算机视觉在人工智能里面可以类比于人类的眼睛,是在感知层上最为重要的核心技术之一。它在各个行业都有或多或少的应用,涉及的技术、学科都非常的广泛。随着5G时代的到来,将会推动医疗、自动驾驶发挥发展,同时会加大推动计算机视觉在这些行业的应用,例如医疗影像识别、自动驾驶中的影响识别等等。随着算法的更迭、硬件升级、大数据的爆发,计算机视觉也将会有更大的想象空间。
【参考文献】
[1] (美)萨利斯基著.艾海舟,兴军亮等译.计算机视觉—算法与应用[M].北京:清华大学出版社,2012.
[2] 张波.数字图像处理技术的发展与应用[J].品牌 :理论月刊,2011(Z2):158-158.
[3] 甄栋志,朱永伟,苏楠等.基于计算机视觉对目标识别检测的研究[J].机械工程与自动化,2014(1):129-130.
[4]杨雪.基于纹理基元快的图像语义分割[D].西南科技大学,2015.
[5]吴 璟 莉,刘 袁 静.一种基于颜色拮抗感受野的轮廓检测模型[J].计 算 机 科 学,2016,43(7):319-323.
[6]160-183.姜枫,顾庆,郝慧珍.基于内容的图像分割方法综述[J].软件学报,2017,28(1):160-183.
[7]王嫣然,陈清亮,吴俊君.面向复杂环境的图像语义分割方法综述[J].计算机科学,2019,46(9):36-46.[3]KRIZHEVSKY A,SUTSKEVER I,HINTON G.ImageNet classifica.