kaggle

GAN网络之入门教程(四)之基于DCGAN动漫头像生成

徘徊边缘 提交于 2020-08-17 16:07:21
目录 使用前准备 数据集 定义参数 构建网络 构建G网络 构建D网络 构建GAN网络 关于GAN的小trick 训练 总结 参考 这一篇博客以代码为主,主要是来介绍如果使用keras构建一个DCGAN,然后基于DCGAN,做一个自动生成动漫头像。训练过程如下(50轮的训练过程)“ 关于DCGAN或者GAN的相关知识,可以参考 GAN网络入门教程 。建议先了解相关知识,再来看这一篇博客。 项目地址: GitHub 使用前准备 首先的首先,我们肯定是需要数据集的,这里使用的数据集来自 kaggle——Anime Faces 。里面有21551张动漫头像的图片。大家可以到kaggle上面去下载数据集,或者说到我的 github 上去下载数据集(求个 ⭐ 不过分吧)。部分数据如下: 如果自己电脑计算机资源不是很强的话,比如我,一个mx250小水管(玩玩lol还是可以的,训练这个模型可能要等到下辈子),推荐大家去注册一个kaggle或者colab账号去白嫖GPU资源(1080,2080的玩家请随意)。不过个人更加的推荐kaggle,因为感觉它的资源分配是可见的,且可以后台运行。 数据集 数据集是动漫图片,我们可以将图片的像素点的值变成 \([-1,1]\) 之间,具体代码如下: # 数据集的位置 avatar_img_path = "./data" import imageio import

2020年度最佳的23个的机器学习项目(附源代码)

依然范特西╮ 提交于 2020-08-16 06:16:04
来源:大数据文摘 本文约 5300字 ,建议阅读 10分钟。 本文为你介绍 23种 机器学习项目创意,以获取有关该增长技术的真实经验。 我们都知道,教科书上所学与实际操作还是有出入的,那关于机器学习有什么好的项目可以实操吗? 我们为你推荐这篇文章,在本教程中,涵盖面向初学者,中级专家和专家的23种机器学习项目创意,以获取有关该增长技术的真实经验。这些机器学习项目构想将帮助你了解在职业生涯中取得成功、和当下就业所需的所有实践。 通过项目学习是你短期内能做的最好投资,这些项目构想使你能够快速发展和增强机器学习技能。语言上,这些机器学习项目可以用Python,R或任何其他工具开发。 面向初学者的机器学习项目 在本部分中,我们列出了针对初学者/初学者的顶级机器学习项目,如果你已经从事基础机器学习项目,请跳至下一部分:中级机器学习项目 1.鸢尾花分类项目 项目构想:鸢尾花有不同的种类,你可以根据花瓣和萼片的长度来区分它们。这是机器学习初学者预测新鸢尾花种类的基础项目。 数据集:鸢尾花分类数据集 https://archive.ics.uci.edu/ml/datasets/Iris 2. Emojify –使用Python创建自己的表情符号 项目构想:该机器学习项目的目标是对人的面部表情进行分类并将其映射为表情符号。我们将建立一个卷积神经网络来识别面部表情。然后

GAN网络之入门教程(四)之基于DCGAN动漫头像生成

|▌冷眼眸甩不掉的悲伤 提交于 2020-08-16 00:11:40
目录 使用前准备 数据集 定义参数 构建网络 构建G网络 构建D网络 构建GAN网络 关于GAN的小trick 训练 总结 参考 这一篇博客以代码为主,主要是来介绍如果使用keras构建一个DCGAN,然后基于DCGAN,做一个自动生成动漫头像。训练过程如下(50轮的训练过程)“ 关于DCGAN或者GAN的相关知识,可以参考 GAN网络入门教程 。建议先了解相关知识,再来看这一篇博客。 项目地址: GitHub 使用前准备 首先的首先,我们肯定是需要数据集的,这里使用的数据集来自 kaggle——Anime Faces 。里面有21551张动漫头像的图片。大家可以到kaggle上面去下载数据集,或者说到我的 github 上去下载数据集(求个 ⭐ 不过分吧)。部分数据如下: 如果自己电脑计算机资源不是很强的话,比如我,一个mx250小水管(玩玩lol还是可以的,训练这个模型可能要等到下辈子),推荐大家去注册一个kaggle或者colab账号去白嫖GPU资源(1080,2080的玩家请随意)。不过个人更加的推荐kaggle,因为感觉它的资源分配是可见的,且可以后台运行。 数据集 数据集是动漫图片,我们可以将图片的像素点的值变成 \([-1,1]\) 之间,具体代码如下: # 数据集的位置 avatar_img_path = "./data" import imageio import

GAN网络之入门教程(四)之基于DCGAN动漫头像生成

老子叫甜甜 提交于 2020-08-15 18:57:02
目录 使用前准备 数据集 定义参数 构建网络 构建G网络 构建D网络 构建GAN网络 关于GAN的小trick 训练 总结 参考 这一篇博客以代码为主,主要是来介绍如果使用keras构建一个DCGAN,然后基于DCGAN,做一个自动生成动漫头像。训练过程如下(50轮的训练过程)“ 关于DCGAN或者GAN的相关知识,可以参考 GAN网络入门教程 。建议先了解相关知识,再来看这一篇博客。 项目地址: GitHub 使用前准备 首先的首先,我们肯定是需要数据集的,这里使用的数据集来自 kaggle——Anime Faces 。里面有21551张动漫头像的图片。大家可以到kaggle上面去下载数据集,或者说到我的 github 上去下载数据集(求个 ⭐ 不过分吧)。部分数据如下: 如果自己电脑计算机资源不是很强的话,比如我,一个mx250小水管(玩玩lol还是可以的,训练这个模型可能要等到下辈子),推荐大家去注册一个kaggle或者colab账号去白嫖GPU资源(1080,2080的玩家请随意)。不过个人更加的推荐kaggle,因为感觉它的资源分配是可见的,且可以后台运行。 数据集 数据集是动漫图片,我们可以将图片的像素点的值变成 \([-1,1]\) 之间,具体代码如下: # 数据集的位置 avatar_img_path = "./data" import imageio import

170多万篇论文,存储量达1.1 TB,Kaggle上线arXiv完整数据集

一笑奈何 提交于 2020-08-15 08:18:36
  机器之心报道    编辑:杜伟、小舟    现在,用户可以在 Kaggle 平台上获取 arXiv 论文了!   众所周知,arXiv 是我们搜索、浏览和下载学术论文的重要工具。近 30 年来,arXiv 为公众和研究社区提供了开放获取学术论文的服务。这些论文涉及物理学的庞大分支和计算机科学的众多子学科,如数学、统计学、电气工程、定量生物学和经济学等等。      arXiv 上研究论文数量之多有利也有弊。一方面,对于在自身研究领域迅速成长的研究生,以及致力于用科研为公众提供服务的研究者而言,这一丰富的信息库可以提供极有效的助力。另一方面,arXiv 有时在搜索时也有不便。   与此同时,Kaggle 通常是数据科学家和机器学习工程师寻求有趣数据集、公开笔记和赛题的重要平台。研究者可以利用 Kaggle 上广泛的数据探索工具,轻松地与他人共享相关脚本和输出。   所以,是不是可以将 arXiv 上的巨量学术论文打包放在 Kaggle 上呢?   近期,为了让 arXiv 可用度更高, 康奈尔大学和其他一些开发者在 kaggle 上创建了一个免费、开放的 arXiv 数据集。 该数据集是一个含有 170 多万篇学术论文的存储库,用户可以获取论文的标题、作者、类别、摘要、全文 pdf 等。      arXiv 执行董事 Eleonora Presani 表示:「在 Kaggle

10万视频,所有图像均获授权,Facebook创建大规模Deepfake数据集

久未见 提交于 2020-08-13 08:40:27
   前不久,Facebook 主办的 Deepfake 检测挑战赛(DFDC)落下帷幕。近日,Facebook撰文介绍了其构建的大规模 Deepfake 数据集 DFDC。   数据集经常存在有关版权、隐私方面的争议,而 Facebook 构建的这个数据集规避了这方面的风险,它包含的所有数据均获得图像所有者本人授权。      Deepfakes 是近期出现的一种直接可用的视频换脸技术。除了 Deepfakes 以外,目前还出现了大量基于 GAN 的换脸方法(而且还带有代码)。   这类技术给人们的隐私安全等带来了威胁。为了应对此类威胁,Facebook 创建了一个大型换脸视频数据集 DFDC 以支持 Deepfakes 检测模型的训练,并组织了 Deepfake 检测挑战赛。   该数据集的亮点在于, 所有对象均同意数据集使用其图像或视频,并允许在数据集构建过程中对其数据进行修改 。   DFDC 数据集是目前最大的公开可用换脸视频数据集,包含来自 3426 名付费演员的 10 万多个视频片段。这些视频通过多种 Deepfake、GAN 和 non-learned 方法生成。      Deepfake 数据集的规模对比。不管从帧数还是视频数量来看,DFDC 数据集都比其他数据集大一个数量级。   下面,我们来看 DFDC 数据集的构建过程和方法。    源数据   很多

泰坦尼克号里女性更不容易死?Excel分析告诉你,这些人活下来的希望更大!

删除回忆录丶 提交于 2020-08-13 08:17:19
转载自:可乐的数据分析之路 这是一个很经典的案例,很多博主都写过,对,就是它:泰坦尼克号生存率的分析,它是kaggle上的一道题,通过船上乘客的信息分析和建模,预测哪些乘客得以生还。 我们就非常粗暴地拿这个数据集做一个简单的分析好了。 使用工具:Excel(对,就是这么简单粗暴) 一、明确目的 1912年泰坦尼克号撞上冰山沉没,船上2224名乘客和机组人员中有1502人遇难,幸存下来的人是出于运气还是存在一定的规律?这是我们比较关心的,所以就要提出问题: 那些人士生还的可能性大? 其次了解数据,数据集总共有以下的字段,其中name、sex、cabin、embarked、ticket是字符串类型,pclass和survived虽然是数值型,但其含义是标签,我们分别从舱位、乘客、船票和地域的维度出发来分析。 二、数据处理 通过查看,发现Age、fare、embarked、cabin字段都是有缺失的,下面我们一个一个来看。 1、age缺失值处理 筛选age一列为空的有263条数据,缺失率为20%,可以全部填充为年龄的均值或众数,也可以进一步地分析,发现年龄缺失的数据里三等舱的最多,占总缺失值的79%,而三等舱里的未生还的男性占比最多,因此也可以用三等舱年龄的平均值来填充。 这里为了保持数据的真实性,就不做填充处理了。 2、fare缺失值处理 筛选发现fare(票价)只缺失了一个值

GAN网络之入门教程(四)之基于DCGAN动漫头像生成

夙愿已清 提交于 2020-08-13 07:14:07
目录 使用前准备 数据集 定义参数 构建网络 构建G网络 构建D网络 构建GAN网络 关于GAN的小trick 训练 总结 参考 这一篇博客以代码为主,主要是来介绍如果使用keras构建一个DCGAN,然后基于DCGAN,做一个自动生成动漫头像。训练过程如下(50轮的训练过程)“ 关于DCGAN或者GAN的相关知识,可以参考 GAN网络入门教程 。建议先了解相关知识,再来看这一篇博客。 项目地址: GitHub 使用前准备 首先的首先,我们肯定是需要数据集的,这里使用的数据集来自 kaggle——Anime Faces 。里面有21551张动漫头像的图片。大家可以到kaggle上面去下载数据集,或者说到我的 github 上去下载数据集(求个 ⭐ 不过分吧)。部分数据如下: 如果自己电脑计算机资源不是很强的话,比如我,一个mx250小水管(玩玩lol还是可以的,训练这个模型可能要等到下辈子),推荐大家去注册一个kaggle或者colab账号去白嫖GPU资源(1080,2080的玩家请随意)。不过个人更加的推荐kaggle,因为感觉它的资源分配是可见的,且可以后台运行。 数据集 数据集是动漫图片,我们可以将图片的像素点的值变成 \([-1,1]\) 之间,具体代码如下: # 数据集的位置 avatar_img_path = "./data" import imageio import

170多万篇论文,存储量达1.1 TB,Kaggle上线arXiv完整数据集

江枫思渺然 提交于 2020-08-13 06:13:25
现在,用户可以在 Kaggle 平台上获取 arXiv 论文了! 机器之心报道,编辑:杜伟、小舟。 众所周知,arXiv 是我们搜索、浏览和下载学术论文的重要工具。近 30 年来,arXiv 为公众和研究社区提供了开放获取学术论文的服务。这些论文涉及物理学的庞大分支和计算机科学的众多子学科,如数学、统计学、电气工程、定量生物学和经济学等等。 arXiv 上研究论文数量之多有利也有弊。一方面,对于在自身研究领域迅速成长的研究生,以及致力于用科研为公众提供服务的研究者而言,这一丰富的信息库可以提供极有效的助力。另一方面,arXiv 有时在搜索时也有不便。 与此同时,Kaggle 通常是数据科学家和机器学习工程师寻求有趣数据集、公开笔记和赛题的重要平台。研究者可以利用 Kaggle 上广泛的数据探索工具,轻松地与他人共享相关脚本和输出。 所以,是不是可以将 arXiv 上的巨量学术论文打包放在 Kaggle 上呢? 近期,为了让 arXiv 可用度更高, 康奈尔大学和其他一些开发者在 kaggle 上创建了一个免费、开放的 arXiv 数据集。 该数据集是一个含有 170 多万篇学术论文的存储库,用户可以获取论文的标题、作者、类别、摘要、全文 pdf 等。 arXiv 执行董事 Eleonora Presani 表示:「在 Kaggle 上放置完整的 arXiv 语料库,可以极大地增强

常用网站

血红的双手。 提交于 2020-08-12 19:12:17
个人网页 Gqq's blog 学习必备 福师大教务管理系统 超星慕课 智慧树 中国大学MOOC 博客主题搭建 基于 Hexo 小丁的个人博客 Hexo + Github Page 搭建教程 岛 基于 博客园 SimpleMemory Silence 私人云 飒爽师叔-搭建自己私人网盘-Nextcloud docker + onedrive 电纸书/文献 校内知网 Kindle电纸书 学习强国搜题 写blog必备小工具 去除文本空格 MarkDown数学公式编辑器 软件安装 软件管家 我要Google 永久地址 备用地址1 备用地址2 备用地址3 深度学习 吴恩达课程笔记 网易云课堂吴恩达深度学习 Python中文笔记 极市开发者社区 各种数据集 航拍/无人机视频图像数据集 SRCNN到EDSR端到端超分辨率方法发展历程 Kaggle猫狗大战准确率Top 2%web app项目部署 Pytorch版本问题 壁纸 wallpaperflare pinterest 来源: oschina 链接: https://my.oschina.net/u/4327212/blog/4328232