论文部分内容阅读
全维视觉系统是一个涉及计算机科学、机器视觉、图像工程、人工智能等多学科的问题。视觉是人类感知信息的主要途径,人类约80%的信息通过视觉感知。随着图像处理技术和计算机视觉算法的成熟,计算机视觉在自主机器人定位、导航等研究中得到广泛应用。在自主机器人的所有传感器中视觉传感器是最重要的传感器,机器人所获得的大多数外部信息都来自于视觉传感器,研究人员希望机器人通过视觉传感器将环境信息“尽收眼底”。普通摄像头的视场角较小,只能获取视野有限的局部信息,视觉系统的盲区较大,无法满足这种要求,可以采用双目、多目、旋转摄像头等视觉系统来扩大视野,但多图像的拼接和旋转关节机构控制的难度限制了这些系统的应用。全维视觉系统目前是获得大视野图像的最佳方法,全维图像已经成为机器人导航、检测、运动估计和目标跟踪等很多机器视觉应用领域中需要获得的图像,由此可见对全维视觉系统和全维图像的研究是非常必要的。
目前,全维视觉系统和全维图像的研究在理论上和应用上都面临着很多难题;国内外大批学者投身于该领域的研究和探索,并且取得了大量的成果。本文是在这些成果的基础上,对面向自主机器人的全维视觉系统的关键技术进行研究。主要贡献可概括如下:
首先,根据国际足球机器人比赛规则,设计了一种自主足球机器人的全维视觉传感器。对各种类型的反光镜进行比较研究,选用最适合自主足球机器人的双曲面型折反射全维视觉系统,利用单视点的约束条件和方程设计了自主足球机器人全维视觉传感器中反光镜的镜面参数,确定全维视觉传感器的尺寸;解决了全维视觉的系统建模问题,给出全维视觉系统中的一整套数学模型,为建立视觉系统像点和物点之间的坐标映射关系,为全维图像的处理提供必要的模型和计算方法,最后用实验验证了该系统的实用性和有效性。
接着,针对全维视觉系统的标定方法进行了研究,并提出了一种基于最小二乘的二次曲线拟合方法。应用光线追迹法提取空间直线折反射图像上的点,采用基于最小二乘的二次曲线拟合方法拟合直线的折反射图像,最终求出系统成像参数,从而完成对全维中心折反射视觉系统的标定。对真实图像数据的实验表明该方法具有实用性。
然后,针对基于全维视觉的运动目标检测进行了研究。采用一种快速的展开算法将全维图像展开成矩形全景图像,利用非线性畸变模型对展开图像进行畸变校正,消除折反射系统的畸变和图像展开时产生的畸变,将展开图像恢复成用普通CCD摄像头拍摄的图像效果,很好地恢复了图像的形状,为后续的处理提供良好的图像质量;提出一种基于全维图像特性的运动物体检测算法,利用自适应背景建模的方法建立并实时更新背景模型,应用背景减法提取前景,再对前景图像进行相应的图像处理,最终实现对运动物体的有效检测。该算法利用经过展开、畸变校正之后的图像分辨率降低,从而滤掉了噪声和无法在背景减法中去除的阴影的特性来对目标进行检测。实验表明,该算法非常适合在室内环境。当摄像头静止的情况下对运动物体进行实时识别与检测,该方法快速有效。
最后,针对运动物体的定位问题进行研究,提出了一种基于双目全维立体视觉系统的运动球体的定位算法。利用双目立体视觉的成像原理,解决了运动球体与机器人本体之间的定位问题,该算法比其它的定位方法更简便,更适于实时性要求较高的应用。