论文部分内容阅读
图像是人类在日常生活中获取信息的重要媒介之一。随着信息科学技术的发展,数码相机、摄像机走进了人们的生活,成为了每个家庭的生活必需品。然而随着人们对更广视觉范围的场景信息需求越来越多,普通的相机或摄像机拍摄到的视野范围是有限的。因此,视频拼接技术可以用来获取全景视频图像。视频拼接将多个同步运行的摄像设备上采集得到的不同位置,不同角度并且有部分重叠区域的视频图像,拼接得到全景视频图像。视频拼接技术是在图像拼接技术的基础上发展而来的,实质上是对视频帧进行拼接。图像拼接主要步骤有图像配准和图像融合,这两个阶段对视频拼接实时性有着直接影响。因此,如何在保证拼接质量的同时,提高拼接速度是实时视频拼接的难点。本文的主要研究工作和创新点如下:(1)提出了一种基于改进SURF特征的视频图像配准算法。本文对SURF特征检测算法进行研究,结合视频拼接实时性的要求对其进行改进:利用相位相关法求视频图像间的位移,估计相邻视频图像间的重叠区域,仅在重叠区域内提取特征点,提高了特征检测的效率。在特征点配准阶段,把SURF特征匹配搜索区域限制在相应的位移位置的一个区域内,可以减少需要搜索的特征点数量,从而提高特征匹配的正确率和效率。最后对配准后的图像求取变换矩阵。(2)在融合阶段,提出了一种改进的多分辨率图像融合算法。首先利用基于块的曝光校正技术来解决因曝光而产生的视频图像之间过度不连续问题,从而对相邻图像间的颜色进行校正;然后,在坐标变换后的图像的重叠区域内进行搜索,寻找最佳缝合线;最后,为了使得拼接过渡流畅,本文结合多分辨率融合算法,在每层分辨率图像上采用最佳缝合线进行融合,重构得到完整的全景视频图像。(3)设计与实现了一个实时视频拼接原型系统。由于拼接算法耗时较多,仅仅对算法进行优化很难满足实时性要求。本文从GPU编程模型出发,在视频图像变换和融合阶段使用NVIDA提供的CUDA架构对算法进行优化,以达到实时性的要求,设计与实现了一个实时视频拼接原型系统。