论文部分内容阅读
基于双目立体视觉的深度估计是计算机视觉中的基础问题,在三维人脸重建与识别、人体姿态估计、三维场景恢复等领域均有重要应用。本论文对双目深度估计任务进行了深入研究,此外本文还将双目深度估计应用到人脸活体检测任务中,主要研究成果如下:论文设计并实现了一个融合边缘检测的双目立体匹配网络,针对性地提升了图像细节及边缘处视差预测的质量。本论文提出的多任务学习网络,在主流数据库上取得了当前领先水平的双目立体匹配及深度估计效果。该结构由一个边缘检测子网络和一个视差估计子网络构成,并包含两个高效的功能模块:上下文信息金字塔模块,用于编码双目立体匹配任务中的多尺度全局信息;残差金字塔模块,建模视差预测及修正在单一解码器结构中完成。此外,为实现边缘检测任务与双目立体匹配任务间的多任务学习,论文设计了一种边缘感知的视差平滑性损失函数,通过论文提出的多阶段训练策略,证明基于论文提出的模型,边缘检测任务与双目立体匹配任务可以相互促进。论文对基于双目视觉深度特征与表观特征相结合的人脸活体检测问题进行了研究,提出了两种人脸防伪算法。第一种人脸防伪算法为模板脸配准的双目深度特征与空间金字塔编码的微纹理特征相结合的真伪人脸特征组合判定算法,通过设计的模板脸匹配算法刻画真假人脸在立体结构上的差异,利用双目深度特征与表观微纹理特征的互补性进行人脸活体判断;为进一步提升算法鲁棒性,论文提出了第二种人脸防伪算法即深度学习检测网络与空间金字塔编码的微纹理特征相结合的真伪人脸特征组合判定算法。在主流数据库上的实验证明,论文提出的算法取得了当前领先水平的人脸活体检测效果。