【摘 要】
:
生成对抗网络作为一种重要的深度生成方法,它具有与输入数据维度线性相关的计算复杂度、不需要对目标数据分布做出任何先验假设、生成逼真样本的能力十分出色等显著优势。生成对抗网络已广泛应用在计算机视觉和自然语言处理等众多领域上,它可以生成各类真实的自然图像、文本、语音等数据。然而生成对抗网络存在的训练不稳定、生成结果存在模式坍塌现象等问题制约着其进一步地发展及应用。因此,改进生成对抗网络的研究及其应用不仅
论文部分内容阅读
生成对抗网络作为一种重要的深度生成方法,它具有与输入数据维度线性相关的计算复杂度、不需要对目标数据分布做出任何先验假设、生成逼真样本的能力十分出色等显著优势。生成对抗网络已广泛应用在计算机视觉和自然语言处理等众多领域上,它可以生成各类真实的自然图像、文本、语音等数据。然而生成对抗网络存在的训练不稳定、生成结果存在模式坍塌现象等问题制约着其进一步地发展及应用。因此,改进生成对抗网络的研究及其应用不仅可改善生成各类图像和自然语言数据,还可启发和推动各类半监督学习和无监督学习任务,该研究对深度生成模型的更进一步的发展具有重要意义。本论文主要研究通过引入自注意力机制改进现有的生成对抗网络模型,以及生成对抗网络在多年龄段人脸衰老图像合成任务上的应用。本论文通过理论分析和实验验证等方式对生成网络的改进及应用进行创新性地探索,主要的创新点包含以下三个方面:1、针对现有的生成对抗网络生成图像的像素之间缺乏长程相关性的问题,本工作创新地对自注意力机制进行改进,并将它引入到生成对抗网络算法中。通过实验验证了利用自注意力机制可以建模像素之间的长程相关性,并且该机制可进一步提升生成对抗网络的性能。2、针对现有的自注意力机制建模像素之间的长程相关性能力弱的问题,本工作创新地将自然语言处理领域的Synthesizer自注意力机制进行改进,并将它引入到生成对抗网络算法中。通过实验验证该机制可以更好地建模像素之间的长程相关性,并更好地提升生成对抗网络的性能。针对现有的自注意力机制计算复杂度高的问题,本工作创新地对Linformer自注意力机制进行改进,并将它引入到生成对抗网络算法中。理论分析和实验验证都表明Linformer自注意力机制可以在保留其机制有效性的基础上,大幅度地改善自注意力机制的计算复杂度。针对现有的多头自注意力机制计算复杂度高与不同注意力头之间缺少联系和约束的问题,本工作创新地将动态卷积的思想引入到多头自注意力机制中,并提出动态多头的自注意力机制。通过实验验证该机制不仅可以大幅度降低多头自注意力机制的计算复杂度,还可以更进一步改善生成模型的生成效果。3、针对现有的生成对抗网络生成的多年龄段面部衰老图像缺乏个性化和多样性的问题,本工作创新地将循环对抗网络进行改进,并利用它生成逼真的人脸衰老图像。通过在循环对抗网络上加入辅助分类器,该模型可以完成多年龄段的人脸衰老图像合成任务。通过实验验证了本文方法在图像真实性、年龄准确性、身份一致性等相关指标上都可以取得很好的结果。
其他文献
临床医学中眼底图像能反映各种疾病的早期症状,眼科医生可通过视网膜血管实现早期诊断。现实世界中视网膜血管结构复杂且医师在诊断时具备主观性,因此设计一种视网膜血管自动分割方法对于减轻医师负担和早期诊断至关重要。当前医学图像领域中深度学习已成为主流方法,它相较于传统分割方法避免了人工提取特征的过程,使得最终分割结果更为客观。本文基于上述背景,采用深度学习从以下三个方面进行视网膜血管分割研究:1.基于编码
分类是机器学习领域经典而核心的问题,也是人脸识别、图像分割、目标重识别、目标检测等复杂任务的基础,分类结果的质量好坏直接关系着上层复杂任务的性能。随着社会和科学的不断发展,日益增长的人工智能和深度学习的工程应用对分类这一基础任务的性能(泛化性及鲁棒性)也提出了更高的要求。本文以基于深度学习的大间隔分类方法为研究课题,着眼于广泛使用的Softmax交叉熵损失函数的分类方法,重点研究在当下大间隔分类方
随着物联网技术的蓬勃发展,基于室内位置服务的市场需求与日俱增。室内定位中的指纹式定位方法因其在复杂的室内环境中抗干扰能力强得到广泛应用。传统的指纹式室内定位算法假设离线建库阶段的信号强度分布与在线定位阶段的信号强度分布是一致的。然而,信号强度分布经常因环境变化、设备异构等因素发生变化,此外无线接入点的缺失或新增会导致特征维度异构。迁移学习通过将源域的知识迁移到目标域中可以减轻环境变化和设备异构引起
分布式阵列是当下研究热点。分布式阵列的协作波束成形技术用于通信网络中信号的定向发送和接收,通过多天线发送相同的信息,将多路信号进行合成,得到所需的理想数据信号。每个传输节点作为单独的发送端同时发送。由于传输节点的不同在频率、时间、相位上存在偏差,导致接收端信号强度损失。此外,在现实的阵列系统中,受到阵列几何不确定性以及电磁耦合等多方面因素影响,阵列误差广泛地存在且不可避免。各类算法基于理想化所建立
目前,深度学习算法已经广泛应用于SAR(Synthetic Aperture Radar)图像的舰船目标检测领域。不过,由于舰船目标在SAR图像中呈现分布稀疏、尺寸差异大、长宽比悬殊等特点,这导致传统Faster R-CNN算法检测这种类型的舰船目标时存在准确率低、漏检率高等问题。针对上述问题,本文开展的主要工作如下:首先,针对传统Faster R-CNN算法在检测舰船目标存在的局限性,提出了一种
随着社交媒体成为主流传播途径,信息量远超人工审核能力。同时,确保信息有效性是保障社会公序良俗的关键,因此遏制假新闻传播已成为亟待解决的问题。但假新闻数量多、形式杂导致难以进行有效监管。传统方法通过概率模型进行判别,但模型搭建难、技术落地成本高且效果不理想。本文聚焦于新闻真实性鉴别,以多特征融合方法为主要研究方法,基于深度学习的方法,搭建了新闻实体鉴别模型以及新闻图像鉴别模型。(1)多特征融合新闻真
多源传感器管理通过资源分配支撑传感器网络完成多目标跟踪及多目标分类等任务,并且通过多任务调度提高系统响应速度。本文对多目标跟踪及多目标分类下的传感器部署分配以及多任务调度进行研究,提出两种算法及一种模型。主要工作及成果包括:1、针对多目标跟踪情景中传感器应当采取何种策略选取哪个或哪几个目标进行跟踪的问题,本文设计模糊逻辑系统从目标与传感器之间的距离、目标的速度、加速度以及航向角四个维度来量化目标威
雨天采集的图像和视频中,视觉内容极易受到雨水遮挡,能见度低,为我们正确理解视觉信号内容带来了巨大挑战,迫切需要高效的视觉信号去雨方法。然而,由于雨水在时空域的外观变化剧烈,且分布不尽相同,为我们有效去除雨水,并保护无雨区域的纹理细节带来了诸多困难。为了解决上述问题,本文从刻画雨水在图像视频中的时空域变化特点出发,展开了视觉信号去雨算法研究:(1)针对雨水在空域上分布不均、外观各异的特点,提出了基于
深度学习模型在很多识别或分类的视觉任务中均效果出众,能够取得极高的预测准确率,但当被识别或分类的图像被添加一些人眼无法察觉的对抗扰动时,识别器或分类器的预测准确率便迅速下降,这一过程被称为对抗攻击,被添加扰动的图像被称为对抗样本。在生成对抗样本的研究工作中,对于已知模型内部参数的白盒攻击方法和针对全图像素区域的扰动添加方法,攻击成功率已经达到了很高的水平。但是在未知模型内部参数的黑盒攻击方法和限制
近年来,越来越多的计算机视觉任务与深度学习相结合并取得了突破。目标检测是众多计算机视觉应用中的底层任务,在工业界的部署十分广泛,因而随着这些算法的成熟和性能提高,越来越多的场景开始尝试计算机视觉算法的落地。在这些任务中,车辆目标检测是前景巨大发展迅速的落地场景之一,比如:车辆停车检测、交通违规检测、无人驾驶等。但与学术界不同的地方在于,除了精度,工业界对算法速度和资源消耗等成本问题更为看重。因此本