论文部分内容阅读
摘要:文章以人工智能技术领域中的图像识别技术为研究对象,首先对人工智能领域下的图像识别技术发展阶段进行了详细的阐述分析,随后分析研究了当下常见的人工智能领域中图像识别技术形式以供参考。
关键词:人工智能;图像识别技术;发展研究
前言
如今在科学技术不断发展的大背景之下,人工智能领域中的图像识别技术也得到了显著的发展,在图像识别类型上也变得更加多样化。从平安证券《通信行业人工智能图像识别专题报告》中我们可以看到,如今的图像识别可分为物体与场景识别、生物识别及视频识别。其中对于生物识别技术来说,预计到2020年,其市场规模将达到250亿美元。由此可以看出,图像识别技术正在逐渐融入我们的日常生活中,无论是人脸识别还是视频识别,我们已经不再感到陌生,因此加强人工智能技术领域中对图像识别技术的研究与探讨,对于推动图像识别技术在我们日常生产生活中进一步实现广泛的应用是非常有意义的。
一、人工智能領域下的图像识别技术发展阶段
(一)图像识别发展初级阶段
在移动互联网不断发展成熟、智能手机不断普及的大背景之下,人们接受信息方式不再仅限于文字,图像、视频等多种信息表现形式逐渐在人们日常信息接收中成为常态,例如我国最大的社交媒体平台之一微信,就是以图片分享作为主要的信息交流方式。并且相对于繁琐的文字而言,图像信息更易于用户理解、接受,再加上智能手机的普及,更加方便人们进行拍摄照片与截屏,从而有效帮助人们更快的利用图片进行信息的记录、采集、分享、传播。但新的问题又随之出现,如今在互联网之上,我们可以轻易利用文字进行信息的搜索,从而找到我们需要的内容,但我们却无法直接对图片中的信息进行检索,图片为我们带来的更加快捷的信息记录与分享方式,却降低了我们的信息检索效率。在这一形势之下,人工智能领域中的图像识别技术的重要性便凸显出来。
人工智能领域中的图像识别技术即是通过借助计算机强大的运算功能,对图像信息进行分析、处理、理解,以达到图像识别翻译的一种技术。初级阶段的图像识别技术仅仅作为一项辅助工具存在,并呈娱乐化、工具化态势发展。例如在娱乐化方面,以百度魔图“大咖配功能”为例,它可以根据用户上传的照片,帮助用户进行搜索,并找到与其长相最为相配的明星。在国外,Face Book研发了“Deep Face”,具备相似的功能,即根据用户的照片进行人脸匹配。这一阶段的图像识别技术还有一个重要的细分领域,同时也是图像识别技术工具化的一种体现,即Optical Character Recognition(光学字符识别),简称OCR,它可以利用计算机与光学设备,通过对字符形状进行识别翻译,并进一步将翻译结果转化为计算机文字。简单来说即是利用计算机进行文字阅读。在比特世界,我们可以轻松借助计算机技术、网络技术对文字进行处理,然而一旦文字以“形状化”、“图像化”形式展现时,针对文字的处理难度便大大增加。当下通过借助OCR技术,我们可以轻松识别日常生活中出现的物理形态的文字信息,例如Google可以对街景图中出现的门牌号进行轻松识别,且识别的正确率高达90%。
初级阶段的图像识别技术就为我们与外部世界交流的方式带来了巨大的改变,正如计算机、网络技术的横空出世一样,使我们把自己部分记忆分包给了搜索引擎,极大扩展了我们的“记忆信息存储空间”;如今随着人工智能技术最为重要的组成部分之一图像识别技术的出现,使我们把自己部分视力分包给了外部机器,极大的扩展了我们的视野范围。如今通过在机器制造上融入图像识别技术,赋予了机器一双“眼睛”,我们再进行信息处理时,不需要先运用大脑将信息转换为计算机可识别理解的语言,然后实现与计算机的交互,得出最终的结果,而是简化为机器利用摄像头对图像信息进行捕捉、识别、分析,并直接与计算机进行信息交互,并自动返回最终的结果。
(二)图像识别技术发展高级阶段
在未来,图像识别技术进入到高级发展阶段,已经不再仅仅作为一种辅助、娱乐性质的工具而存在。通过上文叙述我们可知,如今图像识别技术仍处于初级阶段,它只是为我们的视觉提供一个辅助的作用,一些操作仍需要我们亲自动手完成。在未来图像识别技术发展到了高级阶段,机器可以完全代替我们自主完成所有操作。换句话说,如今的图像识别技术如同盲人手牵的导盲犬,只会为盲人指引方向,路还是由盲人自己来走;高级阶段的图像识别技术通过与其他人工智能技术组合,成功进化为了盲人的贴身管家,一切行动皆交由管家执行,不需要盲人再亲自行动操作。《人工智能:一种现代方法》中提出,人工智能要想完全实现,必须要赋予机器具备感知能力,感知能力主要包含三种,即视觉、听觉与触觉,其中视觉最为重要,究其原因在于,从人类感知世界的过程来看,视觉是最直接、最及时、最准确的一种渠道,相关研究也表明,在人类所有感觉信息中,视觉信息占据80%。因此要想赋予机器如同人类一般的视觉,图像识别技术不失为一种有效的手段,图像识别技术之于人工智能的重要性,如同视觉之于人类的重要性一样,在某些应用领域,因图像识别技术为机器带来的视觉比人类生理视觉更具备优势,更加客观公正,例如在监控中融入成熟的图像识别技术再加上人工智能技术的支持,不再需要人类通过回放监控画面进行判别,而是由计算机自行处置,一旦在监控中识别威胁,会自动发出警报,有效提升监控的质量。
二、人工智能领域中图像识别技术形式
(一)模式识别
在图像识别技术中,模式识别是一项应用较为广泛的图像识别方式,它所观察识别的内容包括了人类感官直接或间接接受的外界信息,模式识别作为一项有效的图像识别模型,主要是通过利用计算机来对人类的识别能力进行模仿,最终达到辨别图像的目的。模式识别一般分为两个阶段,第一个阶段是学习阶段,计算机在获取目标识别图像后,会对图像进行信息采集,然后进行预处理,其整个过程既可以理解为一个存储、学习的过程,通过对图像进行二值化、反色等处理后,来获得识别图像的所有特征数据,即如同人类一样,先记住一个相应图像的基本特征,并以这些特征为依据,进行后续与其特征类似的图像进行识别,记住图像特征的过程即是学习过程。第二个阶段便是实现图像识别的阶段,在这一阶段中,计算机强调的是所需要识别的图像自身特征必须与计算机记忆存储的图像必须完全相符,才能够通过图像识别程序,完成最终的图像识别。计算机在图像识别过程中,通过将记忆存储的图像特征与最新捕捉的图像信息进行一一匹配,如全部匹配成功,即可完成图像识别。
(二)神经网络形式的图像识别技术
所谓神经网络式的图像识别方式,即是通过构建模拟人类神经网络,在传统的图像识别技术上融合神经网络算法,从而让计算机识别方式更加接近于人类识别方式。人工智能领域本就是借助复杂的机器与算法对人类的思考、行为方式进行全面的模拟,力图让机器无限接近于人,从而为人们提供更好更全面的服务。因此神经网络形式的图像识别技术更加体现出自身具备的“人工智能性”。相对于传统的图像识别技术,神经网络形式的图像识别技术能够通过对捕捉到的图像信息利用模拟神经网络中进行映射,图像识别机制更加复杂,同时识别效果也更加准确,例如当前智能汽车监控拍摄系统中的图像识别便是应用的神经网络形式的图像识别技术,它能够对高速行驶的汽车进行精准抓拍,并从得到的图像信息中快速识别出汽车车牌号信息,以达到协同交通管理的作用。
三、总结
综上所述,在人工智能领域中,图像识别技术占据着非常重要的地位,并且应经在诸多行业领域中得到广泛的应用。当下的图像识别技术仍处于发展阶段,仅仅是作为人们日常生产生活中一项辅助的工具,相信在不久的将来,随着图像识别技术不断发展成熟,再辅以其他人工智能领域中的技术,图像识别技术将会发挥更大的价值,造福更多人类。
参考文献:
[1]StuartJ.Russell,PeterNorvig. 人工智能:一种现代的方法(第3版)[J]. 计算机教育,2011(15):68-68.
[2]宋炯,柏松平,王燕华. 基于人工智能的图像识别技术探讨[J]. 科技传播,2018(1)107-107.
[3]翁和王. 关于人工智能中的图像识别技术的研究[J]. 信息通信,2016(10):191-192.
关键词:人工智能;图像识别技术;发展研究
前言
如今在科学技术不断发展的大背景之下,人工智能领域中的图像识别技术也得到了显著的发展,在图像识别类型上也变得更加多样化。从平安证券《通信行业人工智能图像识别专题报告》中我们可以看到,如今的图像识别可分为物体与场景识别、生物识别及视频识别。其中对于生物识别技术来说,预计到2020年,其市场规模将达到250亿美元。由此可以看出,图像识别技术正在逐渐融入我们的日常生活中,无论是人脸识别还是视频识别,我们已经不再感到陌生,因此加强人工智能技术领域中对图像识别技术的研究与探讨,对于推动图像识别技术在我们日常生产生活中进一步实现广泛的应用是非常有意义的。
一、人工智能領域下的图像识别技术发展阶段
(一)图像识别发展初级阶段
在移动互联网不断发展成熟、智能手机不断普及的大背景之下,人们接受信息方式不再仅限于文字,图像、视频等多种信息表现形式逐渐在人们日常信息接收中成为常态,例如我国最大的社交媒体平台之一微信,就是以图片分享作为主要的信息交流方式。并且相对于繁琐的文字而言,图像信息更易于用户理解、接受,再加上智能手机的普及,更加方便人们进行拍摄照片与截屏,从而有效帮助人们更快的利用图片进行信息的记录、采集、分享、传播。但新的问题又随之出现,如今在互联网之上,我们可以轻易利用文字进行信息的搜索,从而找到我们需要的内容,但我们却无法直接对图片中的信息进行检索,图片为我们带来的更加快捷的信息记录与分享方式,却降低了我们的信息检索效率。在这一形势之下,人工智能领域中的图像识别技术的重要性便凸显出来。
人工智能领域中的图像识别技术即是通过借助计算机强大的运算功能,对图像信息进行分析、处理、理解,以达到图像识别翻译的一种技术。初级阶段的图像识别技术仅仅作为一项辅助工具存在,并呈娱乐化、工具化态势发展。例如在娱乐化方面,以百度魔图“大咖配功能”为例,它可以根据用户上传的照片,帮助用户进行搜索,并找到与其长相最为相配的明星。在国外,Face Book研发了“Deep Face”,具备相似的功能,即根据用户的照片进行人脸匹配。这一阶段的图像识别技术还有一个重要的细分领域,同时也是图像识别技术工具化的一种体现,即Optical Character Recognition(光学字符识别),简称OCR,它可以利用计算机与光学设备,通过对字符形状进行识别翻译,并进一步将翻译结果转化为计算机文字。简单来说即是利用计算机进行文字阅读。在比特世界,我们可以轻松借助计算机技术、网络技术对文字进行处理,然而一旦文字以“形状化”、“图像化”形式展现时,针对文字的处理难度便大大增加。当下通过借助OCR技术,我们可以轻松识别日常生活中出现的物理形态的文字信息,例如Google可以对街景图中出现的门牌号进行轻松识别,且识别的正确率高达90%。
初级阶段的图像识别技术就为我们与外部世界交流的方式带来了巨大的改变,正如计算机、网络技术的横空出世一样,使我们把自己部分记忆分包给了搜索引擎,极大扩展了我们的“记忆信息存储空间”;如今随着人工智能技术最为重要的组成部分之一图像识别技术的出现,使我们把自己部分视力分包给了外部机器,极大的扩展了我们的视野范围。如今通过在机器制造上融入图像识别技术,赋予了机器一双“眼睛”,我们再进行信息处理时,不需要先运用大脑将信息转换为计算机可识别理解的语言,然后实现与计算机的交互,得出最终的结果,而是简化为机器利用摄像头对图像信息进行捕捉、识别、分析,并直接与计算机进行信息交互,并自动返回最终的结果。
(二)图像识别技术发展高级阶段
在未来,图像识别技术进入到高级发展阶段,已经不再仅仅作为一种辅助、娱乐性质的工具而存在。通过上文叙述我们可知,如今图像识别技术仍处于初级阶段,它只是为我们的视觉提供一个辅助的作用,一些操作仍需要我们亲自动手完成。在未来图像识别技术发展到了高级阶段,机器可以完全代替我们自主完成所有操作。换句话说,如今的图像识别技术如同盲人手牵的导盲犬,只会为盲人指引方向,路还是由盲人自己来走;高级阶段的图像识别技术通过与其他人工智能技术组合,成功进化为了盲人的贴身管家,一切行动皆交由管家执行,不需要盲人再亲自行动操作。《人工智能:一种现代方法》中提出,人工智能要想完全实现,必须要赋予机器具备感知能力,感知能力主要包含三种,即视觉、听觉与触觉,其中视觉最为重要,究其原因在于,从人类感知世界的过程来看,视觉是最直接、最及时、最准确的一种渠道,相关研究也表明,在人类所有感觉信息中,视觉信息占据80%。因此要想赋予机器如同人类一般的视觉,图像识别技术不失为一种有效的手段,图像识别技术之于人工智能的重要性,如同视觉之于人类的重要性一样,在某些应用领域,因图像识别技术为机器带来的视觉比人类生理视觉更具备优势,更加客观公正,例如在监控中融入成熟的图像识别技术再加上人工智能技术的支持,不再需要人类通过回放监控画面进行判别,而是由计算机自行处置,一旦在监控中识别威胁,会自动发出警报,有效提升监控的质量。
二、人工智能领域中图像识别技术形式
(一)模式识别
在图像识别技术中,模式识别是一项应用较为广泛的图像识别方式,它所观察识别的内容包括了人类感官直接或间接接受的外界信息,模式识别作为一项有效的图像识别模型,主要是通过利用计算机来对人类的识别能力进行模仿,最终达到辨别图像的目的。模式识别一般分为两个阶段,第一个阶段是学习阶段,计算机在获取目标识别图像后,会对图像进行信息采集,然后进行预处理,其整个过程既可以理解为一个存储、学习的过程,通过对图像进行二值化、反色等处理后,来获得识别图像的所有特征数据,即如同人类一样,先记住一个相应图像的基本特征,并以这些特征为依据,进行后续与其特征类似的图像进行识别,记住图像特征的过程即是学习过程。第二个阶段便是实现图像识别的阶段,在这一阶段中,计算机强调的是所需要识别的图像自身特征必须与计算机记忆存储的图像必须完全相符,才能够通过图像识别程序,完成最终的图像识别。计算机在图像识别过程中,通过将记忆存储的图像特征与最新捕捉的图像信息进行一一匹配,如全部匹配成功,即可完成图像识别。
(二)神经网络形式的图像识别技术
所谓神经网络式的图像识别方式,即是通过构建模拟人类神经网络,在传统的图像识别技术上融合神经网络算法,从而让计算机识别方式更加接近于人类识别方式。人工智能领域本就是借助复杂的机器与算法对人类的思考、行为方式进行全面的模拟,力图让机器无限接近于人,从而为人们提供更好更全面的服务。因此神经网络形式的图像识别技术更加体现出自身具备的“人工智能性”。相对于传统的图像识别技术,神经网络形式的图像识别技术能够通过对捕捉到的图像信息利用模拟神经网络中进行映射,图像识别机制更加复杂,同时识别效果也更加准确,例如当前智能汽车监控拍摄系统中的图像识别便是应用的神经网络形式的图像识别技术,它能够对高速行驶的汽车进行精准抓拍,并从得到的图像信息中快速识别出汽车车牌号信息,以达到协同交通管理的作用。
三、总结
综上所述,在人工智能领域中,图像识别技术占据着非常重要的地位,并且应经在诸多行业领域中得到广泛的应用。当下的图像识别技术仍处于发展阶段,仅仅是作为人们日常生产生活中一项辅助的工具,相信在不久的将来,随着图像识别技术不断发展成熟,再辅以其他人工智能领域中的技术,图像识别技术将会发挥更大的价值,造福更多人类。
参考文献:
[1]StuartJ.Russell,PeterNorvig. 人工智能:一种现代的方法(第3版)[J]. 计算机教育,2011(15):68-68.
[2]宋炯,柏松平,王燕华. 基于人工智能的图像识别技术探讨[J]. 科技传播,2018(1)107-107.
[3]翁和王. 关于人工智能中的图像识别技术的研究[J]. 信息通信,2016(10):191-192.