基于计算机视觉的深度信息提取技术的研究

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:iyt1713
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一个多学科交叉的领域,计算机视觉的理论研究和实际应用都取得了飞速的发展。尤其是近年来,图像科学的发展和计算机信息处理能力的增强,为计算机视觉的研究和应用提供了良好的条件。因此,对计算机视觉的进一步研究,具有重要的理论意义和实用价值。计算机视觉的主要研究内容是由多幅二维的平面图像恢复出被摄物体的三维空间信息,而其中基于两幅图像的视觉技术则是一个研究热点。计算机视觉的基本原理是模仿人眼与人类视觉的立体感知过程,从两个视点观察同一景物,以获取不同视角下的感知图像,通过三角测量原理计算图像像素间的位置偏差,以获取景物的三维信息。一个完整的计算机视觉系统通常可分为图像获取、摄像机标定、图像预处理、特征提取、立体匹配和深度确定等六大部分。重点对立体匹配过程进行了详细分析和算法实现。开发了图像获取系统,实现了图像数据的直接内存访问。同时,研究了摄像机标定技术,利用成像过程中的径向约束(RAC)分解摄像机参数,使得求解线性方程组即可得到全部的摄像机参数,避免非线性优化搜索。图像预处理包括图像噪声的平滑、对比度的增强和边缘检测等。在分析研究各种图像预处理算法的基础上,用VC++实现了这些算法。在立体匹配方面,以边缘点为匹配基元,改进了双阈值判断的分阶段立体匹配方法。通过边缘检测、相似性检验和兼容性检验完成了匹配的全过程,并采用双向匹配,以获得更多的最佳匹配点,这样既缩小了匹配搜索空间,又保证了匹配的可靠性。并对得到的离散数据进行了三维重建,恢复深度信息,最终在OpenGL中实现了物体的三维显示。本文针对计算机视觉系统中的各项关键技术,包括图像获取、摄像机标定、图像预处理、特征点提取、立体匹配、三维坐标计算等进行了方法研究和软件仿真实验,验证了所采用方法的正确性和可行性。为开发构建一个完整的计算机视觉系统结构奠定了基础。
其他文献
随着航空运输市场竞争的激烈,航空公司对航段运量预测的工作越来越重视。对于航空公司来说,航段运量预测关系到其对未来发展、运力安排和市场拓展等做出重要决策,关系到其科
Web已成为了网络信息的主要平台,是人们获取信息的重要来源。但是,由于Web页面的无结构性、超链接的自由无序以及Web内容的海量性、多样性和动态变化,人们从Web上搜索真正想要的
随着数据库技术的成熟应用和Internet的迅速发展,从大量数据中挖掘有用的信息成为一个迫切需要解决的问题,数据挖掘的研究应运而生。数据挖掘经常要面对一些有噪声、杂乱、非
特征提取和描述是基于特征的图像处理和计算机视觉的基础环节,特征检测算子的检测性能和描述算子的表针性能直接决定了图像处理的效率和精度。在实际问题中图像可能受到噪声
语义解析是指将自然语言句子转化成计算机能推理的逻辑表达式。近年来,英文语义解析方面的工作硕果累累,有很多语义解析方法被相继提出。其中,基于机器翻译的语义解析方法已
容忍入侵是第三代网络安全技术“生存技术”的核心,与传统的防火墙和入侵检测技术不同,容忍入侵关注的是入侵造成的影响,而非入侵的原因。本文针对目前面向通用服务的容忍入侵系
工作流技术是实现业务过程自动化的关键技术,这些年来逐渐成为研究热点。现有的工作流产品大多庞大复杂、使用困难,而且架构封闭,自成体系,很难与业务应用无缝集成,不适用于
数字水印技术为在网络环境中传播的数字作品的版权保护提供了一种解决方案。在数字水印技术中,如何提高水印鲁棒性是研究的重点与难点。文中介绍了数字水印技术的背景、研究
在计算机技术发展过程中,仿真一直是一个重要的研究领域。指令集仿真器(ISS:Instruction Set Simulator)是在指令集体系结构的层次上对目标机进行模拟,ISS不仅有助于验证处理
随着万维网的飞速发展,XML的应用范围不断扩大,支持XML的数据库成为众人瞩目的焦点。关系型数据库不能很好地支持XML。关系型数据库将XML转换成二维表的形式存储,但XML与二维表