论文部分内容阅读
【摘要】:数字图像和视频数据蕴含了丰富的视觉资源,如何智能化地提取和分析其中的有用信息逐渐成为近年的研究热点。计算机视觉技术在此学术背景下逐渐发展,并已经广泛应用于生产制造、智能安检、图像检索、医疗影像分析、人机交互等领域。与此同时,计算机视觉技术仍然面临诸如语义信息描述模糊、图像特征检测不稳定且效率低下等诸多问题。
【关键词】:计算机视觉;图像特征;发展
1.计算机视觉技术核心问题
视觉问题复杂性的本质在于相对声音等物理信号的描述,视觉信号充满了非常丰富的信息,描述起来也更加困难。比如,很多图像中蕴含了大量简单(如颜色、形状、纹理、几何特征等)及复杂(如场景、字符、物体分布、人物而部特征、人体姿势等)信息并具有较大的动态范围和主观性,如何攻克图像信息提取过程中的各种难题一直是当今计算機图像学研究的热点问题。而且,在科学家们还未完全破译生物视觉系统的奥秘的前提下,大多数CV问题只能采用“逆向推导机制”—依据己知或假设的关联将视觉系统的输入(数字图像)和输出(语义描述)对应起来,通过图片猜测真实世界物体具有的形状,照明度以及颜色分布。因此,基于概率论和数理统计的数学模型是最适合解决这类逆推问题的工具,这也是目前CV领域普遍采用各种统计模型和机器学习算法的本质原因。由于各种学习机制和统计模型需要基于先验知识并建立在对待测图像内容的约束、简化及假设的基础上,和生物视觉几亿年的发展进化相比,其建立的数学模型也只能片而而且粗糙地描绘出视觉系统输入与输出之间的关系。因此,对某组特定图像检测时表现十分优秀的系统,往往对另一组语义相同的图片素手无策;很多看似稳定的机器学习机制,在增加样本种类和数量后,检测率反而会下降;很多设计复杂的检测算法在实际应用中的表现反而不如一些简单且基本的数学描述困。
2.计算机视觉的应用领域
计算机视觉的应用领域主要包括对照片、视频资料如航空照片、卫星照片、视频片段等的解释、精确制导、移动机器人视觉导航、医学辅助诊断、工业机器人的手眼系统、地图绘制、物体三维形状分析与识别及智能人机接口等。
早期进行数字图像处理的目的之一就是要通过采用数字技术提高照片的质量,辅助进行航空照片和卫星照片的读取判别与分类。由于需要判读的照片数量很多,于是希望有自动的视觉系统进行判读解释,在这样的背景下,产生了许多航空照片和卫星照片判读系统与方法。自动判读的进一步应用就是直接确定目标的性质,进行实时的自动分类,并与制导系统相结合。目前常用的制导方式包括激光制导、电视制导和图像制导,在导弹系统中常常将惯性制导与图像制导结合,利用图像进行精确的末制导。
3.计算机视觉技术在工业领域中的应用
计算机视觉系统可用工业领域的很多方面,如零件检验与尺寸测量、零件的缺陷检查、机器人的引导和零件的识工业、木材工业、纺织工别等。应用图象处理及计算机视觉检测技术最多的部门是电子工业,零件装配、其次是汽车业、食品加工工业、包装工业及航空工业等等,已取得的应用成果有产品形状和表而缺陷检查、产品非破坏性检查、机器人、产品分类、其他应用等。
考虑经济效益因素,一般将计算机视觉技术应用飞以下场合在线处理零件;恶劣的制造环境,不适飞人进行操作在运送过程零件可能损坏有大量的小零件需要测量有合适的照明条件。其中,在需要重复检测相同部件或产品的场合中,计算机视觉技术的应用最为广泛,采用的主要技术手段有计算机技术、传感技术、图象处理技术、模式识别等,目的在飞利用这些技术构险价比优良的工业视觉检测装置。如果零件外形变化对加工不重要、或现场照明条件很差、或传感器能够提供所需的信息时,就不需要使用计算机视觉系统。
工业视觉检测过程包括二个步骤,首先是利用各种光源和传感器进行数据采集,实际应用中,输入的源图象多数是256色的灰度图象;其次是对源图象进行数据处理、分析及特征提取,为了得到准确的检测结果,通常先要对源图象进行预处理,大部分情况下,预处理基础上还需应用匹配技术进行物体检测,即先建立模板,然后用已有的模板与被检测物体相配,以便进行分类;最后是输出处理结果。检测系统能否达到预期效果,关键在于第二阶段—数据处理、分析及特征提取阶段中计算机对图象处理的准确程度。
在图象预处理方面,模板匹配前对图象进行预处理,目的在获取源图象的二位边缘图。图象预处理阶段需要完成边缘检测、二仇化等工作。目前,已有很多边缘检测方法,一阶微分算子、二阶微分算子、全局检测方法等。
4.结语
在原有问题上采用新的描述方法、求解手段也是一个可能的突破点。在视觉领域中多数的问题不是问题本身正确与否,而是描述是否恰当以及求解是否有效的问题,因而描述方式、求解手段的探索是十分重要的。总之,随着对定量研究的重视,新的描述方式、求解手段的研究,以及感知手段的改进,计算机视觉的研究必将迎来一个更加繁荣的时代。
5.参考文献
[1]韩瑞珍,何勇. 基于计算机视觉的大田害虫远程自动识别系统[J]. 农业工程学报,2013,(03):156-162.
[2]关然,徐向民,罗雅愉,苗捷,裘索. 基于计算机视觉的手势检测识别技术[J]. 计算机应用与软件,2013,(01):155-159+164.
[3]许志杰,王晶,刘颖,范九伦. 计算机视觉核心技术现状与展望[J]. 西安邮电学院学报,2012,(06):1-8.
[4]江静,张雪松. 基于计算机视觉的深度估计方法[J]. 光电技术应用,2011,(01):51-55.
[5]潘磊庆,屠康,詹歌,刘明,邹秀容. 基于计算机视觉和声学响应信息融合的鸡蛋裂纹检测[J]. 农业工程学报,2010,(11):332-337.
[6]邱茂林,马颂德,李毅. 计算机视觉中摄像机定标综述[J]. 自动化学报,2000,(01):47-59.
【关键词】:计算机视觉;图像特征;发展
1.计算机视觉技术核心问题
视觉问题复杂性的本质在于相对声音等物理信号的描述,视觉信号充满了非常丰富的信息,描述起来也更加困难。比如,很多图像中蕴含了大量简单(如颜色、形状、纹理、几何特征等)及复杂(如场景、字符、物体分布、人物而部特征、人体姿势等)信息并具有较大的动态范围和主观性,如何攻克图像信息提取过程中的各种难题一直是当今计算機图像学研究的热点问题。而且,在科学家们还未完全破译生物视觉系统的奥秘的前提下,大多数CV问题只能采用“逆向推导机制”—依据己知或假设的关联将视觉系统的输入(数字图像)和输出(语义描述)对应起来,通过图片猜测真实世界物体具有的形状,照明度以及颜色分布。因此,基于概率论和数理统计的数学模型是最适合解决这类逆推问题的工具,这也是目前CV领域普遍采用各种统计模型和机器学习算法的本质原因。由于各种学习机制和统计模型需要基于先验知识并建立在对待测图像内容的约束、简化及假设的基础上,和生物视觉几亿年的发展进化相比,其建立的数学模型也只能片而而且粗糙地描绘出视觉系统输入与输出之间的关系。因此,对某组特定图像检测时表现十分优秀的系统,往往对另一组语义相同的图片素手无策;很多看似稳定的机器学习机制,在增加样本种类和数量后,检测率反而会下降;很多设计复杂的检测算法在实际应用中的表现反而不如一些简单且基本的数学描述困。
2.计算机视觉的应用领域
计算机视觉的应用领域主要包括对照片、视频资料如航空照片、卫星照片、视频片段等的解释、精确制导、移动机器人视觉导航、医学辅助诊断、工业机器人的手眼系统、地图绘制、物体三维形状分析与识别及智能人机接口等。
早期进行数字图像处理的目的之一就是要通过采用数字技术提高照片的质量,辅助进行航空照片和卫星照片的读取判别与分类。由于需要判读的照片数量很多,于是希望有自动的视觉系统进行判读解释,在这样的背景下,产生了许多航空照片和卫星照片判读系统与方法。自动判读的进一步应用就是直接确定目标的性质,进行实时的自动分类,并与制导系统相结合。目前常用的制导方式包括激光制导、电视制导和图像制导,在导弹系统中常常将惯性制导与图像制导结合,利用图像进行精确的末制导。
3.计算机视觉技术在工业领域中的应用
计算机视觉系统可用工业领域的很多方面,如零件检验与尺寸测量、零件的缺陷检查、机器人的引导和零件的识工业、木材工业、纺织工别等。应用图象处理及计算机视觉检测技术最多的部门是电子工业,零件装配、其次是汽车业、食品加工工业、包装工业及航空工业等等,已取得的应用成果有产品形状和表而缺陷检查、产品非破坏性检查、机器人、产品分类、其他应用等。
考虑经济效益因素,一般将计算机视觉技术应用飞以下场合在线处理零件;恶劣的制造环境,不适飞人进行操作在运送过程零件可能损坏有大量的小零件需要测量有合适的照明条件。其中,在需要重复检测相同部件或产品的场合中,计算机视觉技术的应用最为广泛,采用的主要技术手段有计算机技术、传感技术、图象处理技术、模式识别等,目的在飞利用这些技术构险价比优良的工业视觉检测装置。如果零件外形变化对加工不重要、或现场照明条件很差、或传感器能够提供所需的信息时,就不需要使用计算机视觉系统。
工业视觉检测过程包括二个步骤,首先是利用各种光源和传感器进行数据采集,实际应用中,输入的源图象多数是256色的灰度图象;其次是对源图象进行数据处理、分析及特征提取,为了得到准确的检测结果,通常先要对源图象进行预处理,大部分情况下,预处理基础上还需应用匹配技术进行物体检测,即先建立模板,然后用已有的模板与被检测物体相配,以便进行分类;最后是输出处理结果。检测系统能否达到预期效果,关键在于第二阶段—数据处理、分析及特征提取阶段中计算机对图象处理的准确程度。
在图象预处理方面,模板匹配前对图象进行预处理,目的在获取源图象的二位边缘图。图象预处理阶段需要完成边缘检测、二仇化等工作。目前,已有很多边缘检测方法,一阶微分算子、二阶微分算子、全局检测方法等。
4.结语
在原有问题上采用新的描述方法、求解手段也是一个可能的突破点。在视觉领域中多数的问题不是问题本身正确与否,而是描述是否恰当以及求解是否有效的问题,因而描述方式、求解手段的探索是十分重要的。总之,随着对定量研究的重视,新的描述方式、求解手段的研究,以及感知手段的改进,计算机视觉的研究必将迎来一个更加繁荣的时代。
5.参考文献
[1]韩瑞珍,何勇. 基于计算机视觉的大田害虫远程自动识别系统[J]. 农业工程学报,2013,(03):156-162.
[2]关然,徐向民,罗雅愉,苗捷,裘索. 基于计算机视觉的手势检测识别技术[J]. 计算机应用与软件,2013,(01):155-159+164.
[3]许志杰,王晶,刘颖,范九伦. 计算机视觉核心技术现状与展望[J]. 西安邮电学院学报,2012,(06):1-8.
[4]江静,张雪松. 基于计算机视觉的深度估计方法[J]. 光电技术应用,2011,(01):51-55.
[5]潘磊庆,屠康,詹歌,刘明,邹秀容. 基于计算机视觉和声学响应信息融合的鸡蛋裂纹检测[J]. 农业工程学报,2010,(11):332-337.
[6]邱茂林,马颂德,李毅. 计算机视觉中摄像机定标综述[J]. 自动化学报,2000,(01):47-59.