浅析“人脸生成”网站的相关技术

来源 :锦绣·下旬刊 | 被引量 : 0次 | 上传用户:982114
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:近年来人工智能发展非常迅速,有不少人工智能领域的科研成果成功“出圈”,走进大众视野。其中一项人脸生成技术令全世界感到震惊,因为仅靠人的眼睛已经无法明显区分由该技术生成的照片与真实照片之间的差异。在惊讶之余也有不少人希望了解这项技术具体是如何实现的,对此,本文将作简要分析。
  关键词:人工智能;人工神经网络;StyleGAN
  2019年初,网站“这个人不存在”一经发布便火遍全网。每次进入网站,页面会展示一张面带微笑的人脸照片。但神奇的是,图片上看起来如此逼真的人脸,其实并不存在于这个世界。这些人脸是AI,即人工智能生成的。网站的创建者Philip Wang在社交网站上表明,他希望通过这种方式提高大众对一项最新研究成果StyleGAN的认知。StyleGAN是NVIDIA于2018年发布的新项目,归属于人工智能领域的人工神经网络范畴。对于这项技术具体是怎么实现的,应该从源头讲起。
  一、人工神经网络
  当前的人工智能分为三个学派。一是符号主义,符号主义认为人工智能起源于数学领域。二是连接主义,原理是模拟大脑的神经网络结构。三是行为主义,主要原理是控制加感知,通过模拟生物的行为来实现人工智能。
  而我们要说的人工神经网络则归属于连接主义。它类似大脑,由特定结构的神经元及连接方法构成。为了模拟神经元之间信息的传递,每个基本处理单元都被合适的变换函数控制其状态。网络包含多个层次,这些层被归类为三个种类,即输入层,隐藏层,输出层。
  由于人工智神经网络具有运算速度高,适应性强,容错力强和自组织的优良特性,使得深度学习这个新的研究方向诞生。相比人工神经网络,深度学习算法强调的是网络结构的深度。目前经典的深度学习模型包括自动编码器神经网络,深度信任神经网络和卷积神经网络等。卷积神经网络可以算是人工智能在图像识别应用领域最主流的算法之一,在大数据的支持下,卷积神经网络可以对大批图像进行准确分类。
  二、StyleGAN
  (一)StyleGAN的基本模型
  StyleGAN是基于生成对抗网络研发的。生成对抗网络是无指导的卷积神经网络中最具前景的方法之一。它是lanJ.Goodfellow等人在2014年提出的通过对抗过程预计生成模型的新型框架。对抗过程即为GANS的核心,由生成模型和判别模型组成。生成模型,指在给出的样本上,使用某个模型来生成新的数据。判别模型则有一个判断标准,或者说判断界限,通过这个界限去区分样本。简单来说,GANs中生成模型用于尽可能地创造一张在人类角度看来是真实的图片,而判断模型的任务是区分真实和伪造的图片。通过不断博弈,若生成模型成功“欺骗”了判别模型,那么我们的目的就达到了。
  单从原理上讲,生成对抗网络的生成模型和判别模型并没有什么限制,我们可以使用任何生成模型和判别模型去实现,生成对抗网络主要是提供了一种框架。正因为如此,生成对抗网络目前已衍生出上百种模型,在这些模型的基础上,又产生了许多变种,使得其功能更完善,网络结构更稳定。
  (二)StyleGAN的前身
  作为GANs的衍生种类,ProGAN希望生成的图像有超高的分辨率。若要达此目的,GANs的网络结构会非常多,从而造成训练这样一个网络既困难又费时。为了解决这一阻碍,ProGAN的思路是,最初训练的时候,使网络的层数较少,这样我们非常容易就能生成图片,但图片的分辨率自然会很低。在训练过程中,逐步加深网络层数,随着训练次数的增加,生成的图片也会越来越高清,最终甚至能生成1024*1024分辨率的图片。通过这样的方法,ProGAN的学习速度比传统的GANs高出2到6倍。
  由于ProGAN每次增加层数时,开发者没有对其增加控制,而是完全由模型直接生成。我们无法得知在此过程中模型具体学习到了什么。训练时,样本规模大,特征量多,且特征之间是互相关联的,因此ProGAN控制生成具有特定特征图像的能力非常有限。
  (三)StyleGAN的改进
  若我们希望网络能生成我们具体想要的图片,就需要对图片生成过程中网络学习到的特征加以控制。StyleGAN便是在此基础上做了进一步的改进。那么,StyleGAN具体做了什么呢?
  StyleGAN发现,如果使用较好的方法,是可以实现特征的控制的。由于层数的不同生成图片的分辨率也不同,其中的特征也伴随分别率的从低到高由粗糙到高品质,若以此分类,可以将这些特征分为三个种类。最低等的粗糙特征主要是人物姿势,发型轮廓和面部表情等;中等的特征则是五官的形状,发型等;而高品质的特征则是五官的细微特征等。
  首先,为了减少特征之间的关联性,增加映射网络,将输入向量重新编码为中间向量,通过中间向量的属性来控制特征,输入变量用常量值代替。然后通过自适应实例标准化模块将中间向量传输到生成的图像中。为了使生成的图像不失随机性,StyleGAN还将如雀斑,痣,法令纹等更细微的特征作为随机噪声添加到输入向量中。另外,StyleGAN还使用了样式混合,截取中間向量和微调网络的超参数等技巧使生成的图像更逼真。
  三、总结
  目前这类人脸生成网站功能愈加完善,从最初只能生成欧美的成人面部,到现在衍生出“高颜值”生成,“动漫人脸”生成和“亚洲人”生成等类型,甚至可以定制生成的图片。NVIDIA官方已经将StyleGAN的代码开源,感兴趣的朋友可以在官方网站下载,并在Linux及Windows上运行。对于该技术,有少数人表达了他们的焦虑,如今人工智能生成的图片足够以假乱真了,怎么避免有不怀好意的人用此技术做些违法犯罪的事情?好在目前已有学者在研究深度判别伪造图片的技术,同时我相信政府也会出台相应政策规范此类技术的发展。
  参考文献
  [1]蔡自兴等著.人工智能及其应用[M].北京:清华大学出版社.2016.
  [2]陈先昌.基于卷积神经网络的深度学习算法与应用研究[D].浙江工商大学,2014.
  [3]王坤峰,苟超,段艳杰,林懿伦,郑心湖,王飞跃.生成式对抗网络GAN的研究进展与展望[J].自动化学报,2017,43(03):321-332.
  作者简介
  阳雪(1998—),女,汉族,四川广安,本科,研究方向:计算机。
  杨博(1999—),男,汉族,四川广元,本科,研究方向:计算机。
其他文献
在相关涉核活动中,如何有效降低放射性核素的污染是急待解决的问题,随着技术的发展,膜体去污方法在去污操作、废物回收及处理处置等方面具备一定优势,应用较广。本文针对现有研究的表面放射性去污剂存在种类较多、针对不同去污对象的去污效果存在明显差异、技术开发成本较高、二次废物量较大以及去污机理与过程研究尚不深入等方面的问题,主要开展了放射性去污剂功能构筑及机理研究,通过合成制备表面放射性去污剂,研究去污剂作
摘 要:裝配式建筑施工逐渐取代了吊装工序,建筑施工安全管理更加到位,一体化推进建筑工程成为常态,工程施工安全系数整体提高。我们认为,装配式建筑施工依然存在一定的风险隐患,要充分利用学习理论开展施工安全培训,认清装配式建筑施工特点,加强装配式建筑施工的安全管理,注意高处作业的安全防护。  关键词:学习理论;装配式建筑;施工安全  施工安全是影响建筑行业发展的一个至关重要的因素。近年来,国家大力推行装
期刊
摘 要:在平面艺术设计进程中,把字体以及图形进行恰当的使用,是为了达到更好的使用成效,要和所需项目的特质展开匹配。如此不但可以从本质上使得大众对作品的整体造型有更为深刻的印象和理解,并且还可以获得大众的青睐。彰显平面艺术设计作品的优势。其中,图形及文字的使用开始渐渐朝着更为多元化的态势演进,在整体提升了视觉表达成效的同时,也在很大程度上增加了其设计的困难度。这篇文章对于图形及文字在平面艺术设计中的
期刊
阻燃剂的研发一直是企业和学术界的研究重点。聚不饱和磷酸酯(PUPE)的氧指数(LOI)高达32%,但力学性能不能满足广泛的应用。纳米填料由于小尺寸效应可以增强与高分子材料间的界面粘结作用,进而提升材料的力学性能。此外,也可以通过两种化学物质共价键之间的结合从而提升材料的交联密度和空间位阻,以此提升材料的机械强度。本研究在课题组之前的工作基础上,通过引入改性纳米二氧化硅和改性纳米氮化硼,来探讨纳米材
含能材料是一类特殊的功能材料,主要包括炸药、推进剂、烟火药剂和发射药,在军事和民用领域具有广泛的应用。其中,炸药的力学性能及热稳定性是影响武器装备安全性能的重要因素,高能晶体与聚合物基料之间的界面作用对聚合物粘结炸药(PBX)的力学强度及其它性能也具有重要意义。本文选取当前实际应用能量最高的炸药六硝基六氮杂异伍兹烷(CL-20)和典型高能低感炸药1,1-二氨基-2,2-二硝基乙烯(FOX-7)来研
摘 要:艺术设计充分体现了人类文明的发展,艺术设计伴随人类久远。随着社会的进步和发展,艺术设计成为了一种系统的学科,同时,艺术设计的出现推动了国家的发展。而科技的快速进步,使艺术设计呈向多元化方向发展。本文主要对艺术思维,艺术的未来发展方向进行阐述。  关键词:艺术设计;未来;发展方向  一、艺术设计的概述  艺术设计作为一种文化现象,它能够反映社会的物质生产和科学技术水平,同时,艺术设计与社会经
期刊
聚二甲基硅氧烷(PDMS)材料具有许多优异的理化性能,在军工、航空航天和人工智能等高科技领域具有广泛应用。但其在服役过程中不可避免产生损伤,会严重影响材料的稳定性和安全性。为解决这一问题,科研人员将自修复概念引入PDMS材料中,及时修复损伤,保证材料服役的安全性和稳定性。同时,还能延长材料的使用寿命,减少资源浪费,缓解环境压力,对材料可持续发展具有重要意义。自修复材料研究领域始终存在两个重要的问题
摘 要:锅炉烟尘采样检测是文章研究的中心,从采样位置设置、选择采嘴与采样时间、烟尘采样处理、负荷运行、过量空气系数等方面展开探讨,目的在于科学开展锅炉烟尘采样检测工作。  关键词:烟尘采样;测点位置;过量空气系数;负荷运行  生态环境建设力度不断加大,生态环境污染问题是全球关注焦点。锅炉运行过程中,经过不断燃烧排除大量烟尘废气,这些烟尘废气中的悬浮颗粒物排放到大气中,污染大气环境。近些年不断进行“
期刊
氧气是一种绿色且廉价的氧化剂,在有机氧化反应中扮演着重要角色。利用半导体材料在太阳光驱动下活化氧气分子,可以实现从太阳能到化学能的转化,减少化石能源的消耗,对降低碳排放有着重要意义。然而,传统的半导体光催化剂(如BiOBr)存在着许多问题,如光利用效率低,光生载流子迁移速率慢且易复合,对氧气分子的吸附与活化能力弱等,限制了这类材料在光催化氧化反应中的应用。针对上述问题,本论文通过在BiOBr半导体
高放废物的处理是核工业与核技术行业发展所必须面临的重要问题之一。固化处理是目前国际上普遍接受的方案,其中硼硅酸盐玻璃是使用最广泛的固化基材之一。Mo作为高放废物中最丰富的裂变产物之一,是动力堆高放废物的主要成分。然而Mo在普通硼硅酸盐玻璃中通常仅有1-2 mol%的溶解度,这在固化处理时造成了废物包容量方面的局限性。针对高放废物中所富含Mo元素的固化,尽管学者们开展了一定的研究工作,但硼硅酸盐玻璃