计算机视觉开源软件发展综述

来源 :科学与财富 | 被引量 : 0次 | 上传用户:yayabaobao123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:开源软件已成为我国信息化建设和软件产业发展的重要技术来源,创造了显著的经济和社会效益。作为人工智能的重要研究方向,计算机视觉的飞速发展离不开开源软件在该领域的持续深耕。本文将重点梳理计算机视觉相关开源软件应用情况与典型开源软件,为计算机视觉研发人员提供参考。
  关键词:计算机视觉;开源软件;人工智能
  1 引言
  计算机视觉是一门研究如何使机器“看”的科学,即利用图像传感器和计算机代替人眼对图像内容进行解释,实现目标识别、跟踪和测量等功能。根据咨询公司发布的数据[1],2018年全球计算机视觉市场规模已超过300亿元,年均增长超过20%,其中中国市场规模达到120亿元。
  开源软件是指代码创作者依据相关的开源协议,将源代码全部或部分公开,允许用户或开发者进行自主学习、报错、修改、使用等活动,以共同提高软件的质量。经过近20年发展,开源软件已成为我国信息化建设和软件产业发展的重要技术来源,持续推动国产软件技术和产业创新发展,创造了显著的经济和社会效益。
  2 计算机视觉发展概述
  计算机视觉始于20世纪80年代,随着马尔《视觉》一书的问世,标志着计算机视觉成为了一门独立学科。在将近四十年的发展历程中,该学科经历了马尔计算视觉、主动和目的视觉[2][3]、多视几何与分层三维重建和以神经网络为代表的基于学习的视觉[4]四个发展阶段。近四十年来计算机视觉发展过程中具有代表性的理论技术和开源软件,如图1所示。
  传统计算机视觉算法处理过程大致分为特征感知,图像预处理,特征提取,特征筛选,推理预测与识别五个步骤。使用传统方法设计特征需要开发者具备大量经验,在设计特征基础上还需合适的分类器算法,将两者相互配合达到最优效果难度较大。
  随着深度学习研究熱潮持续高涨,计算机视觉领域应用深度学习方法,已成为人工智能的典型应用与研究热点。深度学习方法主要采用端到端的解决思路,即从输入到输出一气呵成。相较于传统方法,深度学习方法具有准确性高,开发便捷等优势,使其成为当下计算机视觉领域最为流行的开发方法。
  3 计算机视觉典型应用领域
  在计算机视觉作为一门学科的发展过程中,开源软件和数据集起到了良好的推动作用。利用开源软件,研究人员可以更加快速地更新和迭代算法。开源数据集则为研究人员提供了公平的算法测试平台。目前,开源软件在计算机视觉方面的典型应用领域有人脸识别、无人驾驶、视觉机器人等。
  3.1 人脸识别
  人脸识别是基于人的面部信息进行身份识别的一种生物识别技术。该技术利用摄像机采集含有人脸的图像或视频流,通过对采集的图像进行预处理提取人脸特征,并与搜索库中人脸样本进行比对,进而对检测到的人脸进行识别。
  人脸识别技术已相对纯熟,并已融入人们的日常生活中。如企业、住宅等门禁系统可通过人脸识别辨识来访人员。国际民航组织要求其118个成员国家和地区必须使用电子护照,人脸识别是首推的识别模式。此外,“刷脸支付”可通过扫描消费者面部即可完成交易,极大提高支付的便捷性。
  目前,与人脸识别相关的代表性开源数据集主要有PubFig、CelebA、Colorferet、MTFL、FaceDB、LFW、Youtube Faces、CASIA-FaceV5等。代表性开源软件有sourceAFIS、OpenBR、AsmLibrary、Insightface、Im2txt和FaceNet等。
  3.2无人驾驶
  无人驾驶通常指汽车、飞机等交通工具依托计算机进行驾驶,无需人为操控的技术。无人驾驶技术集计算机视觉、人工智能、自动控制、体系结构等众多技术于一体,主要通过传感系统感知路况环境,自动规划驾驶路线到达预定目标。其中计算机视觉主要用于路况信息的感知。
  无人驾驶技术主要应用于无人驾驶汽车和无人机方面。早在20世纪80年代,国防科大就已成功研制出我国第一辆无人驾驶汽车。2015年9月,全球第一台无人驾驶大客车在全程无人工干预的条件下成功运行,标志着我国在客车制造方面取得了重大突破;2018年4月,百度与美团正式合作计划在雄安新区无人驾驶送餐试验。除了无人驾驶汽车方面,我国在无人机领域发展势头良好,我国大疆公司的无人机产品已被广泛应用到航拍、遥感测绘、电力巡检、搜索救援等众多方面。
  目前,无人驾驶用到的代表性开源数据集主要有KITTI、Caltech、Daimler pedestrian、nuScenses等。代表性开源软件有Udacity、Autoware、TensorFlow Object Detection API和Detectron等。
  3.3 视觉机器人
  视觉机器人[5]指具有视觉感知功能的机器人。视觉机器人可通过视觉传感器获取环境的二维图像,并通过视觉处理器进行解析,进而转换为机器人理解的符号信息,使机器人具有辨识物体,并确定物体位置的功能。
  视觉机器人研究工作起步较早,现已广泛应用在多个领域中。如工业领域中,使用计算机视觉技术进行高精度PCB定位及SMT元件放置。医疗领域,使用视觉机器人为病患进行手术。此外,对于人眼无法识别的光线范围,可通过红外传感器、超声波传感器等获得视觉信息等。
  目前,视觉机器人广泛使用的开源数据集主要有Commo Objects in Context(COCO)、ImageNet、MNIST、Caltech 101、Pascal VOC等。典型开源软件有AForge.NET、OpenCV等。
  4 计算机视觉领域典型开源软件
  本小节将对部分典型开源软件予以介绍。
  ●OpenCV是Intel于1999年建立的,基于BSD许可的计算机视觉库。OpenCV由一系列C函数和少量C++类构成,轻量并且高效,可以实现众多图像处理和计算机视觉方面的通用算法。OpenCV可运行在Linux、Android、Mac OS等操作系统上,是目前使用最广泛的计算机视觉开源软件库。   ●TensorFlow Object Detection API是Google于2017年基于TensorFlow平台开发的开源目标检测算法库。此算法库中提供了当前流行的Faster-RCNN和SSD框架,也可以自定义模型框架进行目标检测任务,使得创建、训练以及应用目标检测模型更为便捷。
  ●Detectron是Facebook AI研究院于2018年公开的目标检测平台,涵盖业内典型的目标检测、图像分割、关键点检测等算法。该平台基于Python和深度学习框架Caffe2构建,使用灵活,利用其提供的预训练模型,研究人员可以快速试验和评估新的想法。
  ●InsightFace是DeepInsight于2018年在 Mxnet上使用python编写的基于MIT协议的人脸识别算法库,包含人脸识别所用的经典损失函数如Softmax、Sphereface、CosineFace、ArcFace、Combined Margin和TripletLoss,在公开人脸识别数据集拥有较优的性能。
  ●Tesseract是Google发布的一款OCR开源库,使用Tesseract可以方便、快捷地识别图片中的文字内容。Tesseract支持C++、python、Java等编程语言调用,接口友好。由于其完整的功能,可以训练的特点,在开源后备受关注。
  5 未来展望
  开源软件已成为我国信息化建设和产业创新发展的重要推动力,创造了显著的经济和社会效益。就目前计算机视觉领域开源软件发展现状来看,平台化和社区化是发展趋势。成功的平台和社区能够使研究人员更容易推广新算法,沟通效率也会有所提高。尽管我国研究人员在计算机视觉领域的研究十分活跃,但在世界范围内的影响力仍然有限。期待我国抓住开源软件的发展机遇实现计算机视觉等多技术领域的弯道超车。
  参考文献:
  [1] 黄伟.计算机视觉技术及产业化应用态势分析[J].信息通信技术与政策,2018(9):59-62.
  [2] Yamins D. L K., DiCarlo J.J. Using goal-driven deep learning models to understand sensory cortex. Nature Neuroscience, 2016,19(3):356-365.
  [3] Yamins D. L. K et al.Performance-optimized hierarchical models predict neural responses in higher visual cortex, 2014(111):8619-8624.
  [4] LeCun Y et al.Deep Learning.Nature,2015(521):436-444.
  [5] 李阳.机器人视觉技术的原理及应用概述[J].通讯世界,2019(2):198-199.
  作者简介:
  刘亭杉,出生年月:1986年5月21日,性別:女,民族:汉,籍贯(精确到市):山东省招远市,当前职务:工程师,当前职称:助理工程师,学历:博士,研究方向:计算机应用技术.
其他文献
摘 要:当代我国城市化的发展越来越快,人们对城市的环境要求也随之提高。随着城市人口的急剧增多,一些城市在不断地向外扩展,但都是以钢筋水泥为主,既缺乏美感又无法满足人们对居住城市的需求。本文分析了符合美学要求的城市设计、当代城市设计为何缺乏美感以及城市设计如何增加美感等三个问题,对当代城市环境艺术设计提供参考。  关键词:城市环境艺术;设计;美学  一、符合美学要求的城市设计  每个城市居住者都希望
期刊
摘 要: 光纤通信是人类通信历史上一次深远的变革,以光为信号传输介质,具有很多的有点,如抗电磁干扰、传输容量大、传输损耗小等。本文在对具体的光纤通信工程设计做了详细研究后,对于光纤通信的原理进行了详细的分析。对光纤通信通信技术与产业发展中的几个问题做了深入思考,并思考了光纤通信的保护问题。  关键词:光纤通信;原理;光纤保护  一、研究背景及意义  伴随社会的进步与发展,以及人们日益增长的物质与文
期刊
摘 要:本文以信息技术在会计领域中的作用做为铺垫,重点分析了信息技术与会计专业融合后对会计人员的工作内容和岗位职责所带来的影响。并以此为基础,阐述了在该环境下,对会计人员所提出的岗位新要求以及工作适应性等问题,并就此问题提出了相应的对策与建议。  关键词:信息技术;会计人员;适应性;对策  引言  大量的实践证明,经济发展在客观上凸显了会计人员的重要性。随着经济与科学技术的不断进步,对会计人员的岗
期刊
摘 要:在传统的热电厂供热、锅炉供热的基础上,自上世纪末开始,清洁可再生能源的环保性和节能性越来越受到社会重视,应用案例越来越多,供暖需求越来越大。清洁能源的逐步开发和利用,有利于进一步改善生态环境和提高生活质量,其社会效益正在逐步显现。 “煤改气”、 “煤改电”、生物质能供暖、地热供暖等清洁能源供暖方式近年来有一定的推广。新郑市人民政府也出台一系列政策,来最大限度减少煤燃烧带来的环境污染,新郑市
期刊
摘 要:化工机械技术是化工行业运营的基础,随着时代的发展,化工机械技术也要进行技术革新,需要保证经济的发展可持续,如何能够提高化工机械技术的质量和效率是时代赋予人们的要求,为了确保化学工业的快速发展,就必须采取相应的措施对化工机械技术进行治理。新时期的我国面临着化工机械技术需要积极接受挑战,从新材料应用基础、新型制造技术应用基础以及高科技工程应用基础着手进行分析,提高我国整体的化工机械技术水平。
期刊
摘 要:对于企业的发展来说,人力资源管理既是对企业经济上的推广与发展,同时又是企业内部软实力的一种体现。在经济发展的过程中,企业一方面应当考虑是否能够实现经济的持续性,另一方面应当考虑如何结合人力资源管理来促进经济的更好更快发展。  关键词:人力资源;管理;经济;可持续;发展  1人力资源管理的概念与内涵  人力资源管理就是以人为中心,培养优秀人才,掌握相关实用技术,促进人的全面发展,从而利用人力
期刊
摘 要:我国作为一个工业制造大国,在制造方面有着独特的优势。随着社会的不断发展,科技也在飞速进步,特别是电气自动化技术方面也在日趋成熟。电气自动化技术在各个领域得到了广泛应用,其作为我国的前沿科技不断的推动国家经济的增长。在此基础上,本文主要从电气自动化技术特点出发,对我国电气自动化技术应用现状,进行详细的阐述和适当的分析,并对未来的发展形势进行展望,希望能够为电气自动化在未来的发展提供强有力的帮
期刊
摘 要:本文主要介绍了具有冲击倾向性煤层在掘进过程中,局部地段由于围岩较不稳定,巷道顶板比较破碎,锚网支护失效的情况下,采用可缩性工字钢支架支护的方式,为类似地质条件下矿井安全掘进提供了技术保障,具有良好的应用前景和经济效益。  关键词:冲击地压;可伸缩;工字钢支架;支护技术  1概况  硫磺沟煤矿4-5煤层具有冲击倾向性,巷道支护严禁采用金属等刚性支架支护。掘进期间,主要采用锚杆、锚索配合钢带、
期刊
摘 要:交通运输是我国重要的发展企业,是新时期我国现代化发展建设的重要理论。人们要贯通好这一思想的涵义,认真学习交通运输发展的重要性,让我国尽快成为交通强国。本篇文章讲述了新时代的到来,要根据交通运输的基础、社会的矛盾和发展的条件进行交通运输质量的提升,还要以“三大变革”为实施的方向推动交通运输的发展。使交通运输的質量进一步的提升。  关键词:创新;交通运输;高质量发展  我国现在的经济形势已经从
期刊
摘 要:内部控制不仅关系到企业自身的发展,也是广大投资者获取利益的保障。健全有效的内部控制机制不仅关系到企业风险管理问题,更是保持资本市场合理运行、维护资本市场健康发展的重要措施。基于此,企业更有必要站在自身发展目标的角度,将企业风险管理作为核心,致力于识别企业内外部所面临的各种风险,将识别出的风险纳入内部控制管理工作中,本文将从企业内部控制管理与风险管理的相关性角度出发,从内部控制五要素的角度进
期刊