【摘 要】
:
得益于其广泛的应用场景,人脸属性编辑任务近来备受关注。但现有的人脸属性编辑算法很难精确地控制人脸属性,编辑结果存在着严重耦合。论文发现Style GAN2网络中存在着属性特定的控制单元,提出两种属性编辑算法操纵控制单元,实现了更加多样且精准的人脸属性编辑。为了编辑真实人脸,还提出了一种能维持隐编码的可编辑性,同时更准确地重建输入图片的反编码算法。首先,发现网络的中间特征和调制参数存在着明显的局部相
论文部分内容阅读
得益于其广泛的应用场景,人脸属性编辑任务近来备受关注。但现有的人脸属性编辑算法很难精确地控制人脸属性,编辑结果存在着严重耦合。论文发现Style GAN2网络中存在着属性特定的控制单元,提出两种属性编辑算法操纵控制单元,实现了更加多样且精准的人脸属性编辑。为了编辑真实人脸,还提出了一种能维持隐编码的可编辑性,同时更准确地重建输入图片的反编码算法。首先,发现网络的中间特征和调制参数存在着明显的局部相关特性。提出一种基于反向传播的通道相关性计算方法,简单高效地计算调制参数的每一个通道与人脸不同语义区域的相关性。仅裁剪保留属性编辑方向向量中与目标语义区域相关性较大的通道。沿得到的稀疏方向向量移动调制参数,能精准地编辑生成图片属性。其次,验证了关键调制参数通道以及其所调制的特征图共同决定编辑效果的好坏,因此可将其称之为属性特定的控制单元。沿着稀疏方向向量移动调制参数,使用优化得到的向量替换关键特征图对应的卷积核调制参数,实现了对调制参数和特征图的协同修改。最后,设计了一种将真实图片反编码至卷积核级别调制参数空间的反编码算法。为所有卷积层预测一个相同的初始调制参数,接着为中高层卷积预测调制参数残差和表明不同卷积核调制参数沿残差具体移动距离的系数向量,以此构造卷积核级别调制参数。基于以上研究提出的属性编辑算法和反编码算法,论文能实现种类丰富、空间耦合和语义耦合少、编辑效率高的精确属性编辑,具有很高的实用价值。
其他文献
随着以碳化硅为代表的第三代半导体功率器件的兴起,高频化电机驱动系统的可行性大大增加。但高开关频率的特性使得原本就不能忽略的电磁干扰加剧,严重影响系统的可靠性和稳定性。因此,本文选题研究基于碳化硅的交流电机控制系统共模电磁干扰抑制策略。首先,论文研究了电机驱动系统的共模电压频域特性,分析了传导途径中两电平逆变电路主拓扑、线型阻抗网络和电机的主要寄生参数对共模电压的影响,并提取相应参数,进而建立数学模
伴随着人口的大量涌入、机动车数量的激增,中国城市早晚高峰期的交通拥堵问题日益严峻,降低了城市交通可达性,影响城市发展。建设城市轨道交通(urban rail transit,简称URT),被认为是有效解决拥堵影响的途径之一。URT建设成本高,合理规划网络非常重要。为了指导网络规划,学者研究了URT网络的拓扑结构特征以及最优布局,然而,关于URT对城市高峰拥堵时刻的可达性影响的实证研究较少。开展这类
自主水下潜航器(Autonomous Underwater vehicle,AUV)能够极大地拓宽人类在水下空间的能力边界、降低水下高危环境中的作业风险,因而在海洋观测、水雷清扫等领域获得了广泛的应用。但现阶段AUV的智能化水平远不能满足有人/无人协同作战、水下观测组网等新应用场景的需求,而高效、合理的路径规划技术则是提高其智能化水平的关键。路径规划算法需要充分考虑任务需求和自身的能力约束,并保证
快速城市化使得路网结构与功能越发复杂,增加了城市中寻路路线的复杂性,提高了城市居民的出行难度。其中,寻路难度刻画了城市中寻路路线的复杂程度,可以用描述起止点之间特定路线的信息量进行量化。为了提升人们出行的舒适度和安全性,需要深入地了解影响城市路网寻路难度的关键因素,设计寻路难度的降低措施,用于指导、启发城市路网规划,改进、完善当前的导航工具。基于此,本文从信息熵视角出发,量化城市路网的寻路难度,探
现阶段深度学习主要根据数据的预处理以及按照经验搭建网络结构,让学习任务达到令人满意的地步,然而针对不同的学习任务,搭建合适的深度神经网络是比较复杂的。近几年,逐渐有很多学者开始大胆猜测,对于常规的残差神经网络模块可以看成是一种偏微分方程,其中Ruthotto、Haber、林宙晨等人针对这种想法进行了相关研究。本文主要针对热传导型残差神经网络模型和对流扩散型残差神经网络模型做相关的研究。实验一和实验
随钻核磁共振测井技术(Logging While Drilling-Nuclear Magnetic Resonance,LWD-NMR)由于其独特的属性,对于识别储层流体类型、评估产能及测量地层与岩性无关的孔隙度、渗透率等信息具有重大意义。面向随钻核磁共振测井仪器的多物理场参数测量、回波采集、数据处理及存储等需求,设计随钻核磁共振测井仪的主控电路,采用双核DSP+FPGA的多核协同架构,实现仪器
医学影像可以显示人体各部分解剖结构和代谢情况,辅助医师进行病灶定位、诊断鉴别、病情评估等。临床诊断常用的医学成像技术有X光透视、电子计算机断层摄影(CT)、正电子发射断层扫描(PET)、磁共振成像(MRI)、超声成像等。近年来深度学习技术被广泛应用到医学图像分割任务,其中多模分割通过将来自不同模态医学图像的特征信息进行融合和转化,充分利用不同成像方式的医学图像或数据集中的信息,提高分析的准确性。目
图文联合表征是指对图像和文本信息进行联合语义表示。图像和文本是常见的两种模态,同时模态间的联合表征是支持下游任务的基础。因此图文联合表征是多模态领域最重要的研究课题之一。然而,由于图像文本之间存在信息粒度差异与语义匹配歧义,使得图文特征抽取和语义交互面临诸多困难。论文重点研究图文信息的特征抽取与语义交互,以提升图文检索的召回率,同时研究和实现了论文方法在工业系统中的应用。在图像文本信息嵌入方面,主
近年来,随着硬件设备和人工智能的不断发展,智能视频监控得到了广泛的应用,学者们对监控领域算法一直在不断挖掘和突破。本文针对家庭安防监控中的在线动作检测(Online Action Detection,OAD)算法进行了研究,根据任务特点提出了新的网络框架,并取得了较显著的性能提升。另外,本文针对家庭安防监控设计了基于树莓派的硬件监控平台,为算法的实际应用奠定了硬件基础。目前大多数的OAD算法使用单
受到细粒度的任务特性以及数据中存在的各种干扰因素的影响,行人重识别任务对算法提取到的特征的判别能力与抗干扰能力都有较高的要求。为此,本文在多示例空间聚合思想的基础上,分别从提升局部示例判别性、抗遮挡模式发现与身份属性信息学习三个方面展开研究工作。针对特征的判别能力与鲁棒性的问题,一种基于局部示例判别能力增强空间聚合方法被提出,在全局空间聚合的范式下,利用NetVLAD编码提高局部特征的判别能力,同