干货 | 抖音漫画效果解密

依然范特西╮ 提交于 2020-12-17 23:23:27

点击上方AI算法与图像处理”,选择加"星标"或“置顶”

重磅干货,第一时间送达

来源:OpenCV学堂


作者是CSDN博客专家

《图像视频滤镜与人像美颜美妆-算法详解》图书作者

抖音漫画效果

要说最近抖音最火的效果是什么,无疑就是上周推出的漫画效果,这里本人来对该效果进行一些技术分析。

首先,我们先看一下效果展示:

Fig.1 实时版本

Fig.2 图片版本

这个效果可谓非常惊艳,真切的将真人照片转换为了漫画风格,而且支持多人处理,也是因此,一时间刷遍了抖音和朋友圈,周末两天的使用量达到了20亿次以上。


对于抖音的漫画效果,包括两个版本,一个是实时处理版本,也就是抖音上线的第一个版本,如图Fig.1所示,可以实时展示漫画效果;另一个是后来的图片版本,如图Fig.2所示,这个版本更加精细;该功能目前同步上线字节跳动旗下的一些app,比如:抖音/剪映/FaceU等。

下面,我们针对这个动漫效果来做一些技术分析,帮助大家了解一下背后的技术秘密。

技术解密

本人以实时版本为例,经过分析和测试,对该效果做了如下几点总结:

1,实时版本中,漫画并非全图处理,而是基于人脸矩形框区域进行动漫处理;
2,人脸之外的背景区域非漫画效果,而是做了一些类似漫画的滤镜处理;
3,整体漫画分辨率不高;
4,不同的人脸,漫画人脸风格始终保持一致;

本人多年来一直从事人像特效相关工作,这里,我们先了解一下漫画风格的特点,这里总结如下:

1,线条化,漫画风格的边缘比较突出,主要表现为线条感强烈;

2,颜色单一,一种漫画风格往往使用的颜色数比较少,不会像真实照片中那样包含那么多颜色数,往往只有几种颜色搭配,比如新海诚效果,如图Fig.3所示;

Fig.3 新海诚漫画风格举例

3,人脸五官简单、夸张,这一点可以参考大多数漫画的五官分类,抖音漫画的五官绘制模型如下图Fig.4所示;

Fig.4 抖音漫画五官模型

与正常的真人照片相比,鼻子,嘴巴和眉毛基本都以线条来表达,简单清晰,而眼睛则表现为夸张的大眼睛,也比较符合漫画的审美;

有了上述的知识前缀,我们就可以对漫画风格有所理解了。本人先做了一个简单的测试,用美女景甜的图做了漫画效果如下Fig.5:

Fig.5 抖音实时漫画效果举例

通过这个效果我们可以发现对于景甜的人脸五官,漫画效果非常好,但是右图却隐约看到了一个人脸框区域,在这个区域之外的漫画风格好像与人脸框内不太一样,仔细观察,确实如此,这也和前面本人的总结相一致了,也就是说,漫画风格只处理了人脸框区域。

为什么这么做?本人认为有以下几点:

①人像照片包括半身照和全身照以及多人情况,分类复杂,场景也复杂,直接全图处理技术上要更难一点;
②实时版本追求用户的实时处理,对时间消耗要求较高,如果全图处理,很有可能无法达到实时要求;

对于人脸框之外的区域,本人也做了分析,发现,这些区域是做了一些颜色滤镜和 包边特效之类,整体的色调与动漫色调保持一致;

复现与改进

综合以上几点,本人对实时版本的动漫效果算法流程做了如下设计:

1,假设用户图为S,效果图为D,将S进行人脸检测,得到人脸区域图像A,A一般为正方形;
人脸检测技术目前已经较为成熟,开源算法也较多,大家可以自行了解;
2,使用深度学习技术来生成漫画效果,这一步个人猜测,抖音大概率应该是使用的GAN网络,通过图像直接生成效果,即输入图像A,输出人脸漫画效果图B;
目前可以实现漫画效果的可行性网络,本人推荐:Pix2Pix,CycleGan,CartoonGan等,
3,构建一张与A大小相同的正方形蒙版图C,这个蒙版为黑白色,白色表示前景,黑色表示背景,如下图Fig.6中的蒙版所示;
4,对图S进行滤镜调色和保边算法处理,得到图M,使得M的色调与B一致;
5,将M和B按照蒙版C进行Alpha混合,C图像素灰度值表示为alpha值,得到最终效果图D,公式如下:
D = B * alpha + (1 - alpha) * M
6,将D填充到S即可。

整个流程如图Fig.6所示。

Fig.6 抖音漫画剖析图

上述步骤就是本人对抖音实时版漫画效果算法的推演解析,当然,只是个人意见。上述的难点在于第2步骤中,如何生成漫画效果,这个步骤中,如果选用Pix2Pix网络,那么需要成对的样本,也就是一张原图对应一张漫画效果图,这样的样本非常稀缺,也非常难以制作,因此,本人觉得抖音应该没有使用这个方法。而CycleGan不需要成对的样本来训练,因此个人觉得,CycleGan是个不错的选择!


本文主要针对当前最新技术进行了一些细节分析,由于没有实现,因此,代码无从参考,不过,无论是Pix2Pix还是CycleGan,代码在github上都有开源,这个不是什么难事,总之,这个效果,关键问题就是样本和优化。


这里我们给出一些相关代码链接:

Pix2Pix:https://github.com/williamFalcon/pix2pix-kerasCycleGan:https://github.com/simontomaskarlsson/CycleGAN-
Kerashttps://github.com/d1ggs/cycleGAN-kerasCartoonGan:https://github.com/penny4860/Keras-CartoonGan

原文链接:

https://trent.blog.csdn.net/article/details/106958365

最后,本人使用Pix2Pix做了一些其他风格的漫画特效,如下图所示:

作者图书

https://u.jd.com/4bDoGL


最后的最后求一波分享!

     
       
 
      
      
回复“TF2”,获取
《Scikit-Learn、Keras 与 TensorFlow 机器学习实用指南》第二版 PDF

end


个人微信
请注明: 地区+学校/企业+研究方向+昵称
如果没有备注不拉群!

本文分享自微信公众号 - AI算法与图像处理(AI_study)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!