stylegan

28篇论文、6 大主题带你一览 CVPR 2020 研究趋势

為{幸葍}努か 提交于 2020-08-11 22:50:14
     编译 | 陈大鑫   编辑 | 丛 末   首度于线上召开的CVPR 2020 会议已经落下帷幕。今年,大会共有1467篇论文被接收,共举办了29个Tutorial、64个Workshop,线上与会者人数达 7600人。大量的论文,加上今年新采用虚拟会议的形式,曾一度让会议浏览器不堪重负(浏览速度非常慢)。   为了让大家更好地掌握今年会议的总体研究趋势,一位深度学习专业的博士生Yassine Ouali 专门撰写了一篇博客,总结了一些引起他关注的论文,以呈现今年会议的大致面貌。    我们先来看下 CVPR 2020 官方的相关统计数据:   CVPR 往年的增长趋势仍然继续:作者人数增加了20%,提交论文的数量增加了29%,同时为了适应这种扩张,审稿人和领域主席都有增加      今年会议的注册人数共有6424人,相比2019年增加了一千多人。在被接收的1467篇论文中,有335篇 Oral 论文。         与去年相似,就接受论文而言,中国是CVPR的第一贡献者,其中来自清华大学的作者数量最多,其次是美国(按国家)和Google(按组织)。      不出所料,被接收的论文主题多数集中在与学习、识别、检测和理解有关的主题上。但是,人们对诸如高效标签方法(例如,迁移学习),图像合成和机器人感知等相对较新的领域越来越感兴趣

为AI生成内容“正名”:从“深度伪造”到“深度合成”

折月煮酒 提交于 2020-08-08 19:20:59
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 编者按:本文来自微信公众号“脑极体”(ID:unity007),作者:海怪,36氪经授权发布。 在世人对AI的“邪恶性”进行攻诘的浪潮中,AI造假,可能已经是现在排首位的理由了。 自从2017年Deepfake(深度伪造)横空出世以后,人们惊呼原来AI在造假方面简直天赋异禀。此后“AI生成内容”技术,特别是GAN算法的突飞猛进更加印证了这一事实。不仅仅是AI换脸,还有AI自动生成文本、语音、图像、视频等等一切数字内容。 除了AI换脸带来的色情视频泛滥之外,人们更进一步担心AI生成内容技术在隐私侵犯、威胁信息安全、操纵政治选举等方面带来全新挑战。 人们往往会假设,如果任由AI生成的内容在互联网中蔓延,将会更进一步冲毁互联网世界的真实性边界。 (被AI造假的扎克伯格“讽刺”自己的Facebook平台) Deepfake之后,真相何在? 如果哪些是真,哪些是假,普通人都难以分辨的时候,那么组成社会基石的真相和信任将就此坍塌,但我们似乎还没有做好活在“无信任社会”的准备吧。 德国哲学家康德在《实践理性批判》中论证“人为什么不能说谎”的法则,揭示了“无信任社会”的悖论和荒谬。假如“人人可以说谎”是一条社会的通行法则,那么,每个人都不会再信任另一个人说的话,这样说话人的谎言也就不会得逞

3个月实现产品落地,这个GitHub 8000星的AI实时换脸项目有APP了

假如想象 提交于 2020-08-06 11:55:59
  机器之心报道    编辑:魔王、蛋酱    让视频会议不再枯燥,一键换脸,想用谁的身份开会就用谁的身份。现在,这个名为 Avatarify 的 AI 换脸项目可以在苹果商店中下载使用了。   人类对于角色扮演的热情永远不会消退,这也是 AI 换脸广受追捧的原因。   三个月前,机器之心曾介绍过一个换脸项目 Avatarify。利用这项技术,你可以将自己的脸实时替换成别人的脸,在视频会议中的表现十分流畅。迄今为止这个项目已在 GitHub 上获得了 8.5k 的 star 量。      这个项目主要借助今年三月份发布的一篇 arXiv 论文《First Order Motion》,无需事先对目标图像进行任何训练,就能用另一个人的视频来替换自己的图像。   在使用 Avatarify 时,借助 deepfake 等其他换脸技术,在想要交换的脸部图像上对算法进行训练。通过在目标图像的相似类别上训练算法,该模型支持实时换脸操作。      一阶运动模型整体框架   具体的操作过程也非常简单:   先导入一张静态图片,照片中的五官会随着视频中真人动作做出相应的变化,比如挑眉毛、眨眼睛、说话等动作,看起来就像是换了个人在开会。   更方便的是,开发者已经将它做成了 app,目前可在苹果商店下载。      Avatarify 已上架 APP Store。  

AI算法参照奥巴马却生成白人面孔,大牛LeCun连发17条推文回复争议

喜欢而已 提交于 2020-08-06 03:52:45
  我们先来看一组对比图:      上图左侧,打了马赛克的图片有没有很熟悉的感觉?   没错,他就是美国前总统巴拉克 · 奥巴马(Barack Obama)。不是故意打码,而是有人把原图的分辨率降低了许多,所以看起来和打了码一样。   至于右侧的人像,是人工智能技术生成的。它从打了码的奥巴马图像里寻找像素规律,然后重新创造了不存在的人脸。   不知道你有没有意识到,这张 AI 生成的人脸,具有非常明显的白人男性特征,而原图中的奥巴马是个黑人。   这一问题不仅发生在奥巴马身上。用相同的算法,把输入图片替换成亚裔女演员 Lucy Liu 或者西裔女议员 AOC(亚历山德里娅 · 奥卡西奥 - 科尔特斯),依旧生成了白人女性的人脸特征。          这些对比照近日在推特上引发了舆论热议,就连 AI 大神 Yann LeCun 都卷入其中,被其他 AI 学者指责“过于片面地理解 AI 公平性”,不得不连发 17 条推文阐述逻辑,仍然未能完全服众。    人们的普遍担忧是:这些图片充分说明了人工智能技术带有偏见的危险性。    “是 StyleGAN 的训练数据有问题”   生成这些图像的程序使用了一种名为 PULSE 的算法,论文入选了 CVPR 2020 大会,背后的研究团队来自美国杜克大学。   该算法利用所谓的 “放大(upscaling)” 技术来处理视觉数据

人脸合成效果媲美StyleGAN,而它是个自编码器

久未见 提交于 2020-04-28 20:25:09
  机器之心报道    参与:魔王   自编码器(AE)与生成对抗网络(GAN)是复杂分布上无监督学习最具前景的两类方法,它们也经常被拿来比较。人们通常认为自编码器在图像生成上的应用范围比 GAN 窄,那么自编码器到底能不能具备与 GAN 同等的生成能力呢?这篇研究提出的新型自编码器 ALAE 可以给你答案。目前,该论文已被 CVPR 2020 会议接收。   论文地址:https://arxiv.org/pdf/2004.04467.pdf   GitHub 地址:https://github.com/podgorskiy/ALAE   自编码器是一种无监督方法,它通过同时学习编码器-生成器图将「生成性」和「表征性」结合起来。关于自编码器有两个疑问尚未得到解决:   自编码器是否具备和 GAN 同等的生成能力?   自编码器能否学习解耦表征(disentangled representation)?   最近,来自美国西弗吉尼亚大学的研究者提出一种新型自编码器 Adversarial Latent Autoencoder (ALAE),试图解决以上问题。ALAE 是一个通用架构,它能够利用近期 GAN 在训练方面的改进。研究者表示 ALAE 具备与 GAN 相当的生成能力,且能够学习解耦表征。   利用 ALAE 通用架构,该研究设计了两个自编码器:一种基于 MLP 编码器

世界首部AI创作漫画正式发表:StyleGAN神还原《铁臂阿童木》画风,继承手冢治虫衣钵

。_饼干妹妹 提交于 2020-04-23 22:24:34
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 传奇的作者打造传世的作品,但作者逝世了,又该怎么办? 用AI来“传宗接代”。 最近,便有团队利用英伟达的StyleGAN,为已经逝世的传奇漫画家——手冢治虫的作品“续命”。 提到手冢治虫,你可能会觉得陌生,但提到《铁臂阿童木》,“大龄”小伙伴们就再熟悉不过了吧? 为了延续他的作品,来自记忆体制造商KIOXIA的研究人员和艺术团队,与日本株式会社联手,利用深度学习(StyleGAN),创造了世界上第一部由AI生成的漫画——《PHAEDO》。 为了利于生成漫画角色,团队分析了手冢先生数百部漫画作品,包括《铁臂阿童木》、《森林大帝》、《怪医黑杰克》等等。 《PHAEDO》已经在日本《晨间》周刊上发表。 这部新漫画,可以说是很好的传承了手冢先生的衣钵。 让漫画之神的作品“传宗接代” 《PHAEDO》这部漫画,其实是Kioxia公司一个叫#FutureMemories 01 “TEZUKA 2020”的项目。 项目负责人东原良平(Ryohei Orihara)介绍说: 它是由AI和人类,根据手冢治虫的许多记忆创造出一件作品的项目。漫画这种艺术表现形式,在世界范围内广为人知,并且被几代人所阅读和喜爱。 为了让AI学习手冢治虫作品的特点,研究人员将漫画人物面部的特征转化为数据

看GAN如何一步步控制图像生成风格?详解StyleGAN进化过程

跟風遠走 提交于 2020-04-20 13:35:04
GAN 能够有条不紊地控制其生成图像的风格吗? 选自Medium,作者:Jonathan Hui,机器之心编译,参与:魔王、杜伟。 你了解自己的风格吗?大部分 GAN 模型并不了解。那么,GAN 能够有条不紊地控制其生成图像的风格吗? 原版 GAN 基于潜在因子(latent factor)z 生成图像。 通常,潜在因子 z 采样自正态或均匀分布,它们决定了生成内容的类型和风格。 基于此,我们需要解答以下两个重要问题: 为什么 z 是均匀或正态分布? 既然 z 包含元信息,那么它是否应在每个卷积层生成数据的过程中发挥更主要的作用?(而不是仅作为第一层的输入) 注意:本文将使用「风格」(style)来指代元信息,其包含类型信息和风格信息。 下图是 StyleGAN2 生成的图像: 潜在因子 z 机器学习中的潜在因子通常彼此独立,以简化模型训练过程。例如,身高和体重具备高度相关性(个子越高的人通常体重更大)。因此,基于身高、体重计算得到的身体质量指数(body mass index,BMI)较常用于衡量人体肥胖程度,其所需的训练模型复杂度较低。而彼此独立的因子使得模型更易于解释。 在 GAN 中,z 的分布应与真实图像的潜在因子分布类似。如果我们从正态或均匀分布中采样 z,则优化后的模型可能需要 z 来嵌入类型和风格以外的信息。例如,我们为军人生成图像

大规模计算时代:深度生成模型何去何从

给你一囗甜甜゛ 提交于 2020-04-14 11:14:35
【推荐阅读】微服务还能火多久?>>>    作者 |Chunyuan    编辑 | 丛末   人工智能的核心愿望之一是开发算法和技术,使计算机具有合成我们世界上观察到的数据的能力, 比如自然语言,图片等等。   每当我们建立一个模型来模仿这种能力时,该模型就称为生成模型 (Generative Models)。   如果该模型涉及深度神经网络,则该模型是深度生成模型(Deep Generative Models, 简称 DGMs)。   作为深度学习中自我监督学习 (self-supervised learning)技术的一个分支,DGM特别专注于刻画数据的生成过程。这篇文章回顾了DGM的历史,定义和现状,并分享最新的一些研究结果。最终希望启发大家去思考一个共同的主题:如何在大规模预训练时代推进或应用深度生成模型。    1   历史回顾和基础知识:   三种类型的深度生成模型和一个通用技巧   生成模型(Generatitve Models)在传统机器学习中具有悠久的历史,它经常与另外一个主要方法(判别模型,Discriminative Models)区分开。我们可以通过一个故事学到它们有何不同:有两兄弟,他们具有不同的特殊能力,一个具有深入洞察事物内在的能力,而另一个善于学习所见事物之间的差异。在故事里,前者代表生成模型,而后者代表区分模型,他们的特点总结为:   生成模型

大规模计算时代:深度生成模型何去何从

十年热恋 提交于 2020-04-12 17:04:25
©PaperWeekly 原创 · 作者|Chunyuan Li 单位|Microsoft Research Researcher 研究方向|深度生成模型 人工智能的核心愿望之一是开发算法和技术,使计算机具有合成我们世界上观察到的数据的能力, 比如自然语言,图片等等。 每当我们建立一个模型来模仿这种能力时,该模型就称为 生成模型 (Generative Models)。 如果该模型涉及深度神经网络,则该模型是 深度生成模型 (Deep Generative Models, 简称 DGMs)。 作为深度学习中自我监督学习 (self-supervised learning)技术的一个分支,DGM 特别专注于 刻画数据的生成过程 。这篇文章回顾了 DGM 的历史,定义和现状,并分享最新的一些研究结果。最终希望启发大家去思考一个共同的主题: 如何在大规模预训练时代推进或应用深度生成模型。 历史回顾和基础知识:三种类型的深度生成模型和一个通用技巧 生成模型(Generatitve Models)在传统机器学习中具有悠久的历史,它经常与另外一个主要方法(判别模型,Discriminative Models)区分开。我们可以通过一个故事 [1] 学到它们有何不同:有两兄弟,他们具有不同的特殊能力,一个具有深入洞察事物内在的能力,而另一个善于学习所见事物之间的差异。在故事里,前者代表生成模型

stylegan-v2 报错 error: #error "C++ versions less than C++11 are not supported.

元气小坏坏 提交于 2020-04-11 10:03:45
运行stylegan-v2报错: error: #error "C++ versions less than C++11 are not supported. 解决方法: 打开 dnnlib/tflib/custom_ops.py的 修改第64行: 将 cmd = 'nvcc ' + opts.strip() 改为:cmd = 'nvcc --std=c++11 -DNDEBUG ' + opts.strip() 点赞 收藏 分享 文章举报 ML_BOY 发布了78 篇原创文章 · 获赞 239 · 访问量 54万+ 私信 关注 来源: oschina 链接: https://my.oschina.net/u/4363024/blog/3228893