Real-Time Voice Cloning

Speaker Encoder复现: Transfer Learning from Speaker Verification to Multispeaker TTS

笑着哭i 提交于 2020-11-19 23:51:43
0. 说明 跑通他: https://github.com/CorentinJ/Real-Time-Voice-Cloning 中文版1: https://github.com/KuangDD/zhrtvc git clone https://github.com/CorentinJ/Real-Time-Voice-Cloning.git cd Real-Time-Voice-Cloning/ 1. 环境 环境名字为: voiceclone_p36 conda create -n voiceclone_p36 python=3.6.5 conda activate voiceclone_p36 conda install pytorch torchvision torchaudio cpuonly -c pytorch conda install -c conda-forge librosa # 这一点是特别的 (把 ffmpeg也顺便装好了 ) 将requirement.txt中的librosa那条删除 conda install tensorflow-gpu==1.14 将requirement.txt中的tensorflow==1.15那条删除 sudo pacman -S python-pyqt5 将requirement.txt中的PyQt5那条删除 再删除一些已经装好的

和马斯克Zoom开个会,竟是AI换脸,GitHub 4000星项目登上热榜

半城伤御伤魂 提交于 2020-04-24 09:46:24
「昨天我和马斯克开会了,正在聊一个两亿的项目。」 机器之心报道,参与:Racoon、蛋酱、兔子。 要是你这么跟朋友说,她可能不信,但你可以甩给她一张 Zoom 的截图,她没准就信了。 实际上,马斯克才不会找你来聊项目,这都是 deepfake 生成的。数以万计的国外网友正在忍受在家办公的枯燥,Zoom 和 Skype 已经成为他们最厌倦的软件。 因此很多人迷上了 AI 换脸。现在,你可以用 Avatarify 将自己的脸替换成别人的脸,并且是实时的,在视频会议中的表现也十分流畅。目前这个项目已经登上了 GitHub 热榜,短短几天揽获 4000 多星。 项目地址: https:// github.com/alievk/avata rify 效果展示 如上图所示,作者将一张红色格子衫的照片导入,照片中的五官也会随着视频中真人的五官动作做出相应的变化。当挑起眉毛,眨眼睛,说话等等动作时,新的图像都会和真实的操作者保持一致。所以,在实时视频中换脸也就毫无违和感了,看起来真如同换了个人在开会! 当然,你也可以尝试一些更有意思的,比如看爱因斯坦眨眼睛,埃米纳姆的凝视,乔布斯挑眉毛,还有被玩坏了的蒙娜丽莎等等...... 只要你想,可以换成任何人。 方法介绍 项目作者之一 Ali Aliev 介绍说,Avatarify 使用了今年三月一篇 arXiv 论文的方法「First Order

Github上10个深度学习开源项目,程序员:涨经验的时候到了

怎甘沉沦 提交于 2019-12-06 14:31:05
深度学习背后的主要思想是人工智能应该从大脑中汲取灵感。 这种观点引申出了“神经网络”术语,大脑包含数十亿个神经元,它们之间有成千上万的连接;在许多情况下,深度学习算法类似于大脑,因为大脑和深度学习模型都涉及大量的神经网络。 单个的计算单元(神经元)并不智能,但是当它们彼此交互时会变得智能。 今天给大家推荐10个Gihub上的有趣且高星的开源项目 ,对于开发者来说,希望你能找到一个激发你灵感的有趣项目。 1、UGATIT: 具有图像到图像转换的自适应层实例规范化的无监督生成网络。——Github:3346星 2、Dlrm: 深度学习推荐模型(DLRM)的实现。——Github:1318星 3、实时语音克隆(Real-Time-Voice-Cloning): 在5秒内克隆语音以实时生成任意语音。——Github:4546星 4、RAdam: 适应性学习率的方差及超越。——Github:1902星 5、TensorNetwork: 一个用于轻松高效地处理Tensor网络的库。——Github:783星 6、威震天-LM(Megatron-LM): 正在进行的大规模培训变压器语言模型的研究,包括:BERT&GPT-2。——Github:911星 7、Python_autocomplete: 用于python自动完成的简单神经网络。——Github:621星 8、现实神经网络-对话-头部模型

Github上10个深度学习开源项目,程序员:涨经验的时候到了

戏子无情 提交于 2019-12-06 11:31:32
深度学习背后的主要思想是人工智能应该从大脑中汲取灵感。 这种观点引申出了“神经网络”术语,大脑包含数十亿个神经元,它们之间有成千上万的连接;在许多情况下,深度学习算法类似于大脑,因为大脑和深度学习模型都涉及大量的神经网络。 单个的计算单元(神经元)并不智能,但是当它们彼此交互时会变得智能。 今天给大家推荐10个Gihub上的有趣且高星的开源项目 ,对于开发者来说,希望你能找到一个激发你灵感的有趣项目。 1、UGATIT: 具有图像到图像转换的自适应层实例规范化的无监督生成网络。——Github:3346星 2、Dlrm: 深度学习推荐模型(DLRM)的实现。——Github:1318星 3、实时语音克隆(Real-Time-Voice-Cloning): 在5秒内克隆语音以实时生成任意语音。——Github:4546星 4、RAdam: 适应性学习率的方差及超越。——Github:1902星 5、TensorNetwork: 一个用于轻松高效地处理Tensor网络的库。——Github:783星 6、威震天-LM(Megatron-LM): 正在进行的大规模培训变压器语言模型的研究,包括:BERT&GPT-2。——Github:911星 7、Python_autocomplete: 用于python自动完成的简单神经网络。——Github:621星 8、现实神经网络-对话-头部模型