AI自画像背后的功臣

来源 :电脑爱好者 | 被引量 : 0次 | 上传用户:aa4578
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读

揭开迷雾——了解GAN


  GAN是Generative AdversarialNetworks的缩写,译为生成式对抗网络,它是一种深度学习模型。大家知道要让机器拥有人工智能,大量的学习是必不可少的,现在Al大多使用的是大数据+深度学习的模式,而要让机器深度学习,模型是必不可少的要素。GAN主要由N、A、G组成(图1)。
  N即Networks,深度神经网络,Al通过神经网络可以学习和自我学习,从而掌握很多高深的技术。
  A即Adversarial:对抗,Al通过深度学习后成为“高手”,在模型系统中这个“高手”会和自己对弈,从而在互相对弈中提高技能。
  G即Generative(Model):生成模型,通过神经网络学习以及自我对弈,这样即可生成模型,最终通过不断完善模型和算法,让Al拥有超凡的人工智能。


艺惊四座——GAN工作原理揭秘


  通过上面的描述我们简单了解了GAN的组成,那么在Al的实际运行中,GAN又是怎样实现深度学习,让Al拥有高超的人工智能的呢?
  如上所述,GAN是由神经网络、对抗和模型组成的,其中核心则是对抗。对抗模型也称为GAN框架,这个框架主要由生成模型G和判别模型D组成。在开始训练的时候,系统会把真实样本数据(X)随机传送一份给判别模型D,D的目标是尽可能正确识别出真实样本(如果正确则输出为“真”或者“1”)。同时用于识别的噪声数据样本(Z)也会随机传输一份给生成模型G,G会将处理的数据也传输给D进行判别。这样D既要判断真实的数据(并尽可能识别为真),也要对噪声数据进行识别(尽可能正确地揪出生成的样本,也就是假样本输出为“假”或者0)。在训练过程中双方都不断优化自己,直到达到平衡,即假样本与真样本完全不可区分(图2)。



  当然技术术语的解释总是很晦涩,我们可以用足球运动来进行比喻。在GAN框架中,这里我们将生成模型G比喻为球员的“假摔”,他们的目标是使用各种手段迷惑裁判,使得自己进攻或者防守战术动作是合规的。比如球门前的假摔看上去像真的对方犯规一样,判别模型则相当于裁判,他们的目标是将球员各种混杂在合规战术里的违规动作找出来。在球员和裁判的不断对抗中,球员的“假摔”水平越来越高,裁判识别“假摔”的水平也越来越高。随着两方水平的不断提高,最终谁都无法区分出哪个动作是真正的“假摔”,也就是Al的水平已经实现以假乱真(图3)。
  当然在实际的应用中,Al不是用来制作兴奋剂,而是指其强大的自我纠错和学习能力。借助GAN框架,Al可以拥有人类无法想象的超级能力。比如上一期介绍的自画像,Al可以描绘出入类无法表达的画面。在类似的场景中还有很多有趣的应用,比如在很多广告创意中,艺术家会投入很多时间设计在视觉上与其他元素的形状和纹理相兼容的字形,但是这样手工设计的字形是和当前场景紧密集成在一起的,即使是同一幅画面,如果要制作出同样效果的字形,艺术家也不得不重复劳动,因为根据目前的技术很难将它迁移到其他类似的项目中。
  现在借助GAN的学习,Al可以很轻松地学会并领会艺术家的意图,它会先对画面环境、光线、场景等进行学习,然后对字体在这画面的各种情形进行读取,并将字体的每个元素拆分学习,如对字体的形态、颜色、手法等进行精密学习,从而精准复制出和海报场景非常契合的字形,并将这些原来很难迁移的字形进行任意的移植(图4)。


突破限制——GAN给我们带来更多


  通过上述介绍可以看到,借助GAN框架学习,Al可以掌握甚至超过很多人类掌握的技能。Al的这些技术可以给我们的生活带来很多的便利。
  比如GAN对字体超高的学习能力,它可以被用来学习生成各种各样的字体,同样可以用它来进行个人字体、字迹的辨别。这样以后如果哪个老赖签字却否认是他签名的文字,我们可能不要借助专业的鉴别机构就可以轻松地进行鉴别了(图5)。



  当然GAN还有很多应用,比如基于Age-cGAN开发的应用OLDIFY,可以合成你任意年龄之后或者之前的形态,只要有一张年轻时候的照片,你就可以提前知道自己几十年之后,或者回忆十几年之前的样子,这是不是很有趣(图6)?



  当然GAN框架在很多领域还有非常实用的应用,比如在医学领域,GAN可以通过对复杂疾病的诊断学习,帮助医生在以后的病例中快速对病人做出全面、科学的诊断。警察可以借助GAN从监控視频中将分割图还原成真实照片,将黑白图变成彩色图,对犯罪嫌疑人进行精准的识别,让犯罪嫌疑人无处遁形,我们期待GAN给我们带来更多的应用!
其他文献
首先到https://sourceforge.net/projects/reactos下载操作系统镜像,下载到的是一个标准ISO格式文件。下载后可以通过多种方法安装,常见的方法有以下三种:  第一种是在传统BIOS引导的电脑上,可以准备一个1GB以上的闪存盘,然后启动UntraISO,点击菜单栏的“启动”按钮,选择“写入硬盘映像”,在弹出的窗口中直接点击“写入”按钮,将写入方式选择为“USB-HD
期刊
第1步注册易查分账号  我们所创建的手机查分系统,是由“易查分”免费提供的,因此,教师需要在该网站注册一个账号。其方法如下:  打开易查分的官网:https://yichafen.com/,然后单击已打开网页中的“教师注册”按钮,此时就会弹出注册页面(图1)。然后教师在此页面中输入“手机号”、“单位”和“密码”等注册信息并点击“提交”按钮,完成账户的注册操作即可。第2步上传学生成绩  完成易查分账
期刊
不知不觉,凛冬已至,不知道大家身边是白雪皑皑还是狂风怒吼,抑或落叶仍在飞舞?不管是怎样的场景,相对于生机勃勃的春夏和满怀期许的金秋,冬日总给人一种落寞寂寥的感觉。在这个时候,身边电脑发出的声音即使并不算大,是不是也让人感到有些心烦呢?  其实随着PC市场的发展,各种特色产品日渐丰富,其中以静音为卖点的也不少。那么,希望享受宁静冬日时光的朋友们,就和笔者一起来了解一下这些产品和它们带来的清静世界吧。
期刊
三强争霸战揭幕  在智能手机领域,性能的强弱完全取决于SoC(手机处理器平台,包含CPU、GPU、ISP和Modem等单元),所以关心体验的玩家都会格外看重“芯脏”的参数。随着海思麒麟980、三星Exynos 9820和高通骁龙855这些旗舰级SoC的陆续发布(表1),2019年的高端Android手机已经蓄势待发。现在的问题是,这三颗SoC谁更强悍?后来居上的骁龙855  高通每一代旗舰级SoC
期刊
随着智能手机的功能越来越强大,我们用其进行办公的情况越来越多。但是,在手机上进行文字编辑还是非常的麻烦,不如在电脑中进行处理那样方便。那么,通过什么方法可以尽量弥补手机文字编辑的不足呢?  在手机中进行文档编辑之所以困难,除了没有相应功能的快捷键以外,就是不能方便地进行光标定位。所以我们可以通过安装一款名为“增强输入”的应用(下载地址:http://s u0.im/53qwV2),就可以有效解決这
期刊
一般来说,手机中的应用使用的都是手机默认的音量大小,在不同环境播放声音时,往往需要针对不同APP的音量进行手动调节,从而避免对他人的影响。那么,如何才能在手机系统中对不同的应用设置不同的音量大小呢?  CFan早前曾介紹过类似的方法,而本文则推荐一款名为“场景模式”的小应用(下载地址:http://suo.im/5aVVJ Kz)。启动以后它会要求用户开启“辅助服务”的相关功能,点击“开启”按钮后
期刊
病毒名称:幽虫病毒危害:  在电脑病毒的类型中有一类病毒叫做“木马下载器”,该病毒最主要的特征就是在入侵系統以后,从特定的服务器下载其他的功能模块到系统中释放,然后对系统进行进一步的入侵和破坏。前些年非常有名的“熊猫烧香”就是这类病毒的代表,最近又有一款名为“幽虫”的木马下载器在网络中广泛地传播。该病毒通过游戏外挂、软件激活工具或者盗版系统等方式进行传播,一旦用户的电脑系统不小心运行了该电脑病毒,
期刊
一加6T迈凯伦定制版发布售价4599元  2018年12月14日,一加手机在深圳举行一加五周年特别活动,一加科技CEO刘作虎回顾公司五年历程,一加自成立开始一直坚持精品策略,用好产品与全球用户沟通,逐渐在手机红海市场中走出了一条属于自己的路。五年来,一加坚持不炫技、不炒作,坚守商业的本质只做好产品。刘作虎称这是“安静的力量”,并说:“越是波涛汹涌,越要坚持商业的本质,越要相信时间,甘于安静,这可能
期刊
病毒名称:微信埋雷专家病毒危害:  现在很多用户都喜欢通过微信来发送红包,从而联络亲朋好友之间的感情。最近出现了一款名为“微信埋雷专家”的手机病毒,该病毒伪装成可以操控微信红包埋雷的外挂软件。用户一旦下载安装了这款手机应用,首先它就会要求开启一些重要的权限,接着会将用户微信支付所需要的账户信息进行截图,然后上传到指定的服务器,同时登录微信所需要的验证码以及微信支付密碼等重要信息,它也会通过各种途径
期刊
设计上的差异  魅族Note8和联想S5Pro采用了相似的工艺,它们都是全金属一体化机身以及穹顶式的U型信号条,而并非时下最流行的双面玻璃设计。其中,魅族Note8提供粉色、红色、黑色和蓝色四种颜色版本;而联想S5 Pro则可选金色、黑色和蓝色,二者的三围和重量也在伯仲之间。  两款手机在设计上最大的差异,就是魅族Note8保持着传统的18:9比例的全面屏;联想S5 Pro则是屏占比更高的刘海屏。
期刊