论文部分内容阅读
随着机器学习理论的不断成熟和深度学习技术的迅猛发展,人脸五官图像分割任务近年来得到了相关研究人员的普遍关注。五官图像分割技术可以实现对人脸的细粒度解析,在人脸表情识别、人脸编辑和美容模拟等诸多领域有广泛的应用空间。然而在实际应用时,人脸五官图像分割技术尚存有不足之处。比如,目前主流的人脸五官分割技术采用的是深度学习多网络融合模型,虽然可以获得高精确度的分割效果,但其庞大的网络结构往往需要昂贵的设备支持和较大的时间代价,限制了方法的实际应用。此外,在后续的人脸五官图像拼接应用中,图像之间的清晰度不一致问题,也会严重影响模拟效果。针对上述问题,论文主要研究工作如下:(1)基于人脸关键点定位算法提出一种五官粗定位方法。首先对常见的人脸关键点检测方法进行对比分析,选择级联回归树算法进行实现,并用海伦人脸数据集进行训练,完成对人脸图像的194个特征点进行估计。该方法拥有较低的时间损耗和较高的鲁棒性。进一步地,根据人脸关键点的相对关系提出一种五官粗定位方法,并通过实验确定合适的参数。(2)基于U-Net全卷积网络提高五官分割精度,并通过轻量化网络结构,进一步提升网络计算性能。对于定位不够准确的眉毛和嘴巴部分,在人脸五官粗定位算法的基础上,对常见的全卷积网络进行对比分析,选择U-Net全卷积网络,针对眉毛和嘴巴部分图像分别进行训练并实现精确度更高的分割效果。进一步地,根据特征和图像的尺寸,对网络结构进行轻量化,在确保分割精度的前提下进一步提升计算性能。(3)提出了一种图像间清晰度匹配方法。首先实现4种常见的无参考图像清晰度评价方法,作为对清晰度的多角度定量评价工具,然后实现16种参数不同的模糊算法作为清晰度的多尺度调整工具。为了根据两图之间的清晰度关系选择较合适的模糊算法对图像进行调整,从而使清晰度差值最小化,引入随机森林分类模型作为清晰度匹配的核心选择器。最后,为了补全五官拼接的应用,对泊松融合算法进行了研究和实验。