stylegan

吴恩达Deeplearning.ai国庆节上新:生成对抗网络(GAN)专项课程

南楼画角 提交于 2020-10-06 09:35:37
Coursera 刚刚上新了 GAN 的专项课程,或许在这个国庆假期,你应该学习一波了。 作者:蛋酱 生成对抗网络(Generative Adversarial Network,GAN)是当前功能最强大的机器学习模型之一,其能够生成逼真的图像、视频和语音输出结果。基于 GAN 的应用十分广泛,比如防御对抗攻击和数据匿名化来保护隐私,以提升网络安全性,再比如生成新图像,为黑白图像着色、提高图像分辨率、2D 图像转 3D 等技术。 随着算力的增强,GAN 的普及程度和功能也不断提升,开启了许多新的方向:比如生成大量数据用来训练模型,让无监督模型生成更加清晰、准确的输出图像,同时也为相近研究领域提供了对抗学习、对抗样本、模型鲁棒性等方面的启示。 近日,DeepLearning.AI 推出了《生成对抗网络(GAN)专项课程》,系统介绍了使用 GAN 生成图像的理论及方法。此外还包括机器学习偏见、隐私保护等社会影响话题的讨论。 这门课程适用于对机器学习感兴趣并希望了解 GAN 的工作原理的软件工程师、学生和研究者。专项课程内容尽可能做到通俗易懂,让进入课程的人都真正理解 GAN 并学会使用。 但在进入这门课程之前,学习者应该具备关于深度学习、卷积神经网络的知识,具备一定的 Python 技能和深度学习框架(TensorFlow、Keras、PyTorch)的使用经验,且精通微积分、线性代数

AI还原朱元璋,兵马俑!杜甫唱奥特曼主题曲,B站Up大谷新作

落花浮王杯 提交于 2020-10-01 16:27:06
  机器之心报道    编辑:张倩、蛋酱   朱元璋、林黛玉、兵马俑、杜甫…… 这些历史人物到底长什么样?B 站 up 主「大谷」帮我们用 AI 还原出了一种可能。   无论是理科还是文科的同学,想必都对中学历史课本上的「朱元璋」画像印象深刻。这幅画像里的朱元璋长了一张「鞋拔子脸」,只能用帝王特有的「异相」来解释。      然而,在故宫南熏殿所藏的官方正式版历代帝王画像中,朱元璋的长相就正常多了:      朱元璋到底长什么样?其实这个问题一直都有争议。很多人认为,故宫收藏的官方画像似乎更有说服力,因为这两幅画的相貌相似程度和随年龄的演变不容易造假。   虽然画像可以大体还原古人的长相,但总不及照片来得写实、清晰。最近,国内外似乎掀起了一场用 AI 还原古人的潮流,先是有 设计师用 GAN 和 PS 复原了他眼中的古罗马皇帝群像,后有 B 站 up 主「大谷」用 AI 还原中国皇帝朱元璋,还是能动的那种:      居然有点帅是怎么回事?      此外,大谷此次还复原了林黛玉、徐悲鸿等人的画像以及蒋兆和、黄胄等人经典画作中的人物:      林黛玉。      蒋兆和《老伴》。      徐悲鸿。      黄胄《于阗歌舞图》。   就连博物馆的兵马俑也有了写实的长相:      评论区有人说:「想看秦始皇,以后转账的时候好对比一下。」   前面说到课本

程序员欢乐送(第10期)

非 Y 不嫁゛ 提交于 2020-09-27 13:10:32
程序员欢乐送(第10期) 收录于话题 #程序员欢乐送 59个 对于我来说,我一直保持的追求有三点:技术、快乐、财富。因此,从此三点出发,记录过去一周,我所看到的,值得分享的内容,每周五把欢乐送达。 由于微信不允许外部链接,你需要点击页尾左下角的“阅读原文”,才能访问文章的链接,文中的所有链接已使用蓝色字体标记。 「 技术 Technology 」 1、AI肖像生成 一位来自 Uber 的软件工程师Philip Wang利用英伟达去年发布的StyleGAN研究成果创作了源源不断的假人物头像。每次你刷新这个网站,网络就会从头开始生成新的人脸图像。 以下这些异常逼真的肖像都是算法生成的,并不是真实的人。 体验地址:点击查看 StyleGAN项目地址在《程序员欢乐送(第9期)》中推送过,可以去上篇推送中查看。 2、Remove.bg一键抠图 现在,抠图已经不再是专业设计师才会的技能,其应用的技术图像分割也不是一个新课题了,很早之前就有很多研究成果出现,按照是否使用深度学习的方法可分成传统方法(Blue Screen Matting、Poisson Matting、Bayes Matting、Closed form Matting 与 KNN Matting 等)和基于深度学习的方法(CNN、FCN 和 UNet)等,而深度学习方法的发展也大大提高了抠图的精度。

AI表情包生成器来了,给AI喂了96万个表情包文案,做出的图能接地气吗?

谁都会走 提交于 2020-08-19 13:40:32
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 编者按:本文来自微信公众号“大数据文摘”(ID:BigDataDigest),作者:牛婉杨,36氪经授权发布。 在这个一言不合就斗图的年代,表情包已经成为了人人必需的“装备”。 最近,文摘菌就发现一位外国友人做了个AI表情包生成器,坦白讲这个生成器依然逃不过“沙雕”的标签,就像之前的“狗屁不通文章生成器”和“读后感生成器”。 它的首页是这个样子的👇有48个表情包模板可供使用。 传送门: https://imgflip.com/ai-meme 看到这里有没有朋友好奇“Meme”是什么?事实上,“Meme”就是我们常说的表情包。 网站标题“This Meme Does Not Exist”也延续了之前各种StyleGan生成网站的“不存在”系列,意喻“不存在的表情包”。 接下来就让我们直奔主题,文摘菌要好好看看它能给表情包配上什么字~ 首先,大致扫了一眼,发现最眼熟的就是第二行中间那只doge,确认过眼神,就它了!选中图片之后,就生成了以下表情包: 这个文字配的嘛,大家仔细品,还是比较符合我们日常的表情包风格。再点击刷新,AI又会给这张图配上新的文字,下面这张送给吃货朋友们: 刷新了几次,文摘菌发现,出现次数最多的词汇有“wow”,“such”,“much”等一些百搭词汇

换脸新潮流:BIGO风靡全球的人脸风格迁移技术

三世轮回 提交于 2020-08-16 01:48:50
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 引 1974年,我国的考古学家在陕西省西安市发掘出了兵马俑,并被其神态各异惟妙惟肖的面部表情所震撼。同年,一篇名为《A Parametric Model for Human Faces》论文迈出了人脸属性编辑这一领域的第一步。而半个世纪后的今天,BIGO自主研发的FaceMagic的换脸技术让你随心所欲地化身为兵马俑,世界名画,或者电影里的超级英雄, 产品一推出即风靡全球。 BIGO为了把这项创新技术带给全球用户,研发人员克服了各种挑战。技术挑战主要来源于三个方面:第一是人脸特征迁移技术,我们创新性地尝试把风格迁移的思路用于人脸特征迁移中,克服了当时主流的deep fake、 3D方案等技术的不足。 第二是全球化问题,因为BIGO用户来源于全球各地,为了解决不同人种的肤色、五官结构的差异问题,我们构建了千万量级的全球化的人脸数据集,极大地涵盖肤色、性别、年龄等差异性,力求把全球每一位用户的效果做到最佳 。第三是多属性,多场景的效果优化,我们在不断优化网络结构的同时尝试人脸属性、人脸姿态等约束,并大力提升大规模数据的训练效率,充分挖掘数据的多样性特征,把换脸效果做到更加鲁棒、真实、自然。FaceMagic仍在吸引越来越多人的参与,自上线以来,全球生产总量接近1亿。功能推出后

Hacker News 简讯 2020-07-24

廉价感情. 提交于 2020-08-15 06:00:56
最后更新时间: 2020-07-24 00:41 Show HN: TinyPilot – Build a KVM over IP for Under $100 Using a Raspberry Pi - (mtlynch.io) 展示HN:TinyPilot–使用覆盆子Pi以低于100美元的价格在IP上构建一个KVM 得分:167 | 评论:87 Cognitect Joins Nubank - (cognitect.com) Cognitect连接Nubank 得分:346 | 评论:125 The History, Status, and Future of FPGAs - (acm.org) 燃料电池板的历史、现状和未来 得分:45 | 评论:30 How Inuit Parents Teach Kids to Control Their Anger - (npr.org) 因纽特父母如何教孩子控制愤怒 得分:36 | 评论:4 Launch HN: Sidekick (YC S20) – A new hardware device to connect remote teams 推出HN:助手(YC S20)——一种连接远程团队的新硬件设备 得分:36 | 评论:24 1SecondPainting: Generate abstract paintings in one

28篇论文、6大主题带你一览CVPR2020研究趋势

那年仲夏 提交于 2020-08-14 01:08:16
     编译 | 陈大鑫   编辑 | 丛 末   首度于线上召开的CVPR 2020 会议已经落下帷幕。今年,大会共有1467篇论文被接收,共举办了29个Tutorial、64个Workshop,线上与会者人数达 7600人。大量的论文,加上今年新采用虚拟会议的形式,曾一度让会议浏览器不堪重负(浏览速度非常慢)。   为了让大家更好地掌握今年会议的总体研究趋势,一位深度学习专业的博士生Yassine Ouali 专门撰写了一篇博客,总结了一些引起他关注的论文,以呈现今年会议的大致面貌。    我们先来看下 CVPR 2020 官方的相关统计数据:   CVPR 往年的增长趋势仍然继续:作者人数增加了20%,提交论文的数量增加了29%,同时为了适应这种扩张,审稿人和领域主席都有增加      今年会议的注册人数共有6424人,相比2019年增加了一千多人。在被接收的1467篇论文中,有335篇 Oral 论文。         与去年相似,就接受论文而言,中国是CVPR的第一贡献者,其中来自清华大学的作者数量最多,其次是美国(按国家)和Google(按组织)。      不出所料,被接收的论文主题多数集中在与学习、识别、检测和理解有关的主题上。但是,人们对诸如高效标签方法(例如,迁移学习),图像合成和机器人感知等相对较新的领域越来越感兴趣

10万视频,所有图像均获授权,Facebook创建大规模Deepfake数据集

久未见 提交于 2020-08-13 08:40:27
   前不久,Facebook 主办的 Deepfake 检测挑战赛(DFDC)落下帷幕。近日,Facebook撰文介绍了其构建的大规模 Deepfake 数据集 DFDC。   数据集经常存在有关版权、隐私方面的争议,而 Facebook 构建的这个数据集规避了这方面的风险,它包含的所有数据均获得图像所有者本人授权。      Deepfakes 是近期出现的一种直接可用的视频换脸技术。除了 Deepfakes 以外,目前还出现了大量基于 GAN 的换脸方法(而且还带有代码)。   这类技术给人们的隐私安全等带来了威胁。为了应对此类威胁,Facebook 创建了一个大型换脸视频数据集 DFDC 以支持 Deepfakes 检测模型的训练,并组织了 Deepfake 检测挑战赛。   该数据集的亮点在于, 所有对象均同意数据集使用其图像或视频,并允许在数据集构建过程中对其数据进行修改 。   DFDC 数据集是目前最大的公开可用换脸视频数据集,包含来自 3426 名付费演员的 10 万多个视频片段。这些视频通过多种 Deepfake、GAN 和 non-learned 方法生成。      Deepfake 数据集的规模对比。不管从帧数还是视频数量来看,DFDC 数据集都比其他数据集大一个数量级。   下面,我们来看 DFDC 数据集的构建过程和方法。    源数据   很多

傻瓜式无限P图,MIT朱俊彦团队“重写”深度生成模型

99封情书 提交于 2020-08-12 14:27:26
     作者 | 陈大鑫   编辑 | 丛末   复制一位老人的胡子,把胡子粘贴到全部孩子的眉毛上。该如何实现这样的操作呢?   让我们从塔尖生树的问题说起。   如何在教堂的塔尖上生成一棵树?——当然是使用P图软件啦!      但是P图软件一次只能修改一张图片,难道就没有那种能一键无限张P图的软件吗?   近日,来自MIT朱俊彦团队的一篇论文《Rewriting a Deep Generative Model》就很巧妙地 解决了这个问题,目前该论文已被接收为ECCV 2020 Oral,且代码已开源。   在这篇《重写深度生成模型》论文中,作者不是单独地对一张张图片进行编辑,而是很大胆地提出直接对深度网络的内部生成模型动刀编辑:      在这个规则编辑器中,深度生成模型G(z,w_0) 作为输入,这时模型的初始权重是 w_0,预训练模型G映射一个随机输入向量z到一个真实图像,将权重w_0改成w_1即可产生新的模型作为输出。   利用现有的模型能产生无限数量的图像,那么改变生成模型的规则就能让我们创造新规则下的无限张可改变图像。如下图所示,通过把塔尖的生成模型重写为“树”,一次操作即可在所有教堂的塔尖上都生成一棵树:       1    傻瓜式操作   那这么神奇的重写模型操作起来容易吗,够傻瓜式吗?   为了让读者更好地亲自编辑模型,作者特意创建了一个用户交互界面

3个月实现产品落地,这个GitHub 8000星的AI实时换脸项目有APP了

北战南征 提交于 2020-08-12 02:44:25
让视频会议不再枯燥,一键换脸,想用谁的身份开会就用谁的身份。现在,这个名为 Avatarify 的 AI 换脸项目可以在苹果商店中下载使用了。 机器之心报道,编辑:魔王、蛋酱。 人类对于角色扮演的热情永远不会消退,这也是 AI 换脸广受追捧的原因。 三个月前,机器之心曾介绍过一个 换脸项目 Avatarify 。利用这项技术,你可以将自己的脸实时替换成别人的脸,在视频会议中的表现十分流畅。迄今为止这个项目已在 GitHub 上获得了 8.5k 的 star 量。 这个项目主要借助今年三月份发布的一篇 arXiv 论文《First Order Motion》,无需事先对目标图像进行任何训练,就能用另一个人的视频来替换自己的图像。 在使用 Avatarify 时,借助 deepfake 等其他换脸技术,在想要交换的脸部图像上对算法进行训练。通过在目标图像的相似类别上训练算法,该模型支持实时换脸操作。 一阶运动模型整体框架 具体的操作过程也非常简单: 先导入一张静态图片,照片中的五官会随着视频中真人动作做出相应的变化,比如挑眉毛、眨眼睛、说话等动作,看起来就像是换了个人在开会。 更方便的是,开发者已经将它做成了 app,目前可在苹果商店下载。 Avatarify 已上架 APP Store。 这款应用的使用方法依然非常简单:在 app 中选择一张图片,即可开展一番表情操纵