coco

TensorFlow中最大的30个机器学习数据集

為{幸葍}努か 提交于 2021-02-16 10:12:50
点击上方“AI公园”,关注公众号,选择加“星标“或“置顶” 作者: Limarc Ambalina 编译:ronghuaiyang 导读 包括图像,视频,音频,文本,非常的全。 largest tensorflow datasets for machine learning 由谷歌Brain的研究人员创建的TensorFlow是机器学习和数据科学领域最大的开源数据库之一。它是一个端到端的平台,适用于初学者和有经验的数据科学家。TensorFlow库包括工具、预训练模型、机器学习指南,以及开放数据集的语料库。为了帮助你找到所需的训练数据,本文将简要介绍一些用于机器学习的最大的TensorFlow数据集。我们已经将下面的列表分为图像、视频、音频和文本数据集。 图像数据集 1、 CelebA : 最大的公开的人脸图像数据集之一,名人脸属性数据集(CelebA)包含超过20万名名人的图像。 celebrity face images dataset 每幅图像包含5个面部特征点和40个二值属性标注。 2、 Downsampled Imagenet :该数据集用于密度估计和生成建模任务。它包含130多万幅物体、场景、车辆、人物等图像。这些图像有两种分辨率:32 x 32和64 x 64。 3、 Lsun – Lsun是一个大型图像数据集,用于帮助训练模型理解场景。数据集包含超过900万张图像

FAIR-Detectron 开源代码

我的未来我决定 提交于 2021-02-15 02:26:32
先贴上链接:https://github.com/facebookresearch/Detectron 。。。Install Caffe2 就问题一大堆了。。。。 首先是下载完caffe2工程后,第一步的make ,就出现“Protocol "https" not supported or disabled in libcurl” 试了很多方法,都不管用,哎。 应该是curl的问题,不管了,反正系统已经重装了,现在一切正常,比以前还顺溜~ 装个这玩意让我火大。直接重装系统!!!!! 全新的系统:Ubuntu14.04!!! 显卡:GTX 1080 本以为重装系统的话,cuda这玩意又要倒腾很久,已经做好了长期奋战的准备,结果 - - 时代在进步啊,要是当年有这么好装的话,我也不用装大半个月了。 废话不多说,总结下今天安装 caffe2 的过程。 一、 首先下载依赖项: sudo apt- get update sudo apt-get install -y --no- install - recommends \ build - essential \ cmake \ git \ libgoogle -glog- dev \ libgtest - dev \ libiomp - dev \ libleveldb - dev \ liblmdb - dev \ libopencv -

英伟达开源「Imaginaire」:九大图像及视频合成方法,你学fei了吗?

风流意气都作罢 提交于 2021-02-12 05:39:39
点击上方“ 迈微AI研习社 ”,选择“ 星标★ ”公众号 重磅干货,第一时间送达 图像 / 视频合成领域的集大成者,就在这一篇了。 图像和视频等视觉数据的生成是机器学习和计算机视觉领域重要的研究问题之一。近几年,英伟达提出了 SPADE、MUNIT 等多个图像及视频合成模型。 近日,英伟达又开源了一个新的 PyTorch 库「Imaginaire」,共包含 9 种英伟达开发的图像及视频合成方法。 项目地址: https://github.com/NVlabs/imaginaire 这九种方法分别为: 有监督的图像到图像转换 1、pix2pixHD 2、SPADE/GauGAN 无监督的图像到图像转换 1、UNIT 2、MUNIT 3、FUNIT 4、COCO-FUNIT 视频到视频转换 1、vid2vid 2、fs-vid2vid 3、wc-vid2vid pix2pixHD 「pix2pixHD」是 pix2pix 的升级版本,具备高分辨率图像和语义处理功能,主要解决了深度图像合成编辑中的质量及分辨率问题。 项目主页:https://tcwang0509.github.io/pix2pixHD/ 论文链接:https://arxiv.org/pdf/1711.11585.pdf 在这篇论文中,来自英伟达和 UC 伯克利的研究者提出了一种使用条件 GAN

ResNet、Faster RCNN、Mask RCNN是专利算法吗?盘点何恺明参与发明的专利

爱⌒轻易说出口 提交于 2021-02-08 13:22:39
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 前段时间OpenCV正式将SIFT算法的实现从Non-free模块移到主库,因SIFT专利到期了(专利授权后,从申请日开始有20年的保护期)。 美国林肯总统称" 专利制度是给天才之火浇上利益之油 ",专利保护了申请人的利益,促进了科技的进步,但现在也有越来越多的滥用专利权对产业机构敲诈的案例出现。 SIFT 专利权的终结让我们不得不思考,还有哪些著名的算法被申请了专利?对于做研究的朋友来说不需要考虑这个问题,专利算法依然可以参考、复现、对比,但对于产业界朋友就不得不确认清楚:项目中有没有可能使用了别人专利保护算法。 作为计算机视觉领域当今翘楚,两度获得CVPR 最佳论文奖的何恺明大佬有很多论文都具有重大影响力。其部分论文引用数据: 残差网络 ResNet 被引用 51939 次、目标检测算法 Faster RCNN 被引用 20291 次、实例分割算法 Mask RCNN 被引用 7249 次,暗通道去雾被引用 4274 次,这些知名的算法有成百上千的开源实现,也肯定被大量的商业公司使用,有没有被申请专利? 想想 ResNet 如果被申请专利,那恐怕大多数使用深度学习的商业公司都在侵权了!价值难以估计! 带着这样的疑问,CV君检索了所有与“ Kaiming He ”相关的已经公开的授权专利和专利申请

巧用 CSS 实现酷炫的充电动画

自作多情 提交于 2021-02-08 08:51:25
循序渐进,看看只使用 CSS ,可以鼓捣出什么样的充电动画效果。 画个电池 当然,电池充电,首先得用 CSS 画一个电池,这个不难,随便整一个: 欧了,勉强就是它了。有了电池,那接下来直接充电吧。最最简单的动画,那应该是用色彩把整个电池灌满即可。 方法很多,代码也很简单,直接看效果: 有内味了,如果要求不高,这个勉强也就能够交差了。通过蓝色渐变表示电量,通过色块的位移动画实现充电的动画。但是总感觉少了点什么。 增加阴影及颜色的变化 如果要继续优化的话,需要添加点细节。 我们知道,低电量时,电量通常表示为红色,高电量时表示为绿色。再给整个色块添加点阴影的变化,呼吸的感觉,让充电的效果看起来确实是在动。 知识点 到这里,其实只有一个知识点: 使用 filter: hue-rotate() 对渐变色彩进行色彩过渡变换动画 我们无法对一个渐变色直接进行 animation ,这里通过滤镜对色相进行调整,从而实现了渐变色的变换动画。 上述例子完整的 Demo: CodePen Demo -- Battery Animation One 添加波浪 ok,刚刚算一个小里程碑,接下来再进一步。电量的顶部为一条直线有点呆呆的感觉,这里我们进行改造一下,如果能将顶部直线,改为波浪滚动,效果会更为逼真一点。 改造之后的效果: 使用 CSS 实现这种波浪滚动效果,其实只是用了一种障眼法

全面解析YOLO V4网络结构

空扰寡人 提交于 2021-02-08 02:54:42
作者|周威,https://zhuanlan.zhihu.com/p/150127712 本文已获作者授权,不得二次转载。 1.前言 最近用YOLO V4做车辆检测,配合某一目标追踪算法实现 车辆追踪+轨迹提取 等功能,正好就此结合论文和代码来对 YOLO V4 做个解析。先放上个效果图(半成品),如下: 话不多说,现在就开始对YOLO V4进行总结。 YOLO V4的论文:《 YOLOv4: Optimal Speed and Accuracy of Object Detection》 ,相信大家也是经常看到这几个词眼:大神接棒、YOLO V4来了、Tricks 万花筒等等。 没错,通过阅读YOLO V4的原文,我觉得它更像一篇 目标检测模型Tricks文献综述 ,可见作者在目标检测领域的知识(炼丹技术)积累之多。 从本质上,YOLO V4就是 筛选 了 一些 从YOLO V3发布至今,被用在各式各样检测器上,能够 提高检测精度 的 tricks ,并以YOLO V3为 基础 进行改进的目标检测模型。YOLO V4在保证速度的同时,大幅提高模型的检测精度(当然,这是相较于YOLO V3的)。 上图可以看出来,虽然检测精度不如EfficientDet这种变态,但是速度上是遥遥领先的,说明YOLO V4并没有忘记初心(速度和精度的trade off,我YOLO才是佼佼者)!

深度 | 线下场景的客流数字化探索与应用

怎甘沉沦 提交于 2021-02-04 19:33:33
阿里妹导读:数字化的时代,无论是商场里的大小专柜,还是小区门口的便利店,大多仍处于“数据荒漠”中。店家不知道店内多少商品被人浏览,多少衣服被试穿了,作为顾客的我们也不知道哪些商品是最受同龄人喜爱的畅销好物。 在新零售场景中,线下的行为数据是潜藏的宝矿。如何进行数字化升级,更好辅佐商家和消费者,成为摆在我们眼前的重要课题。 下面,搜索事业部的算法专家京五将为大家详细介绍阿里在线下场景的客流数字化探索与应用。 在互联网时代,数据是所有应用的基础,淘宝的商家可以基于商品历史的点击成交量来判断店内各个商品的情况,并做出相应的运营行为,淘宝的买家会根据商品历史的成交数据,评论数据等,来辅助自己判断是否进行购买,同时我们平台也会基于用户和商品的历史数据,来训练模型,预测各个商品的点击率,预测各个用户的偏好,使展示的结果更符合用户的需求。可以看出,数据对于各个不同的角色都有很重要的作用。 在互联网中,获取数据相对容易,反观线下零售场景,大部分数据都是缺失的,商家并不知道店内多少商品被浏览了,多少商品被试穿了,买家也不知道各件商品的历史数据。 因此,我们的客流数字化相关的探索,就是要将线下的用户和商品的行为数据收集起来,让线下的行为也能有迹可循,为商业决策和市场运营提供准确有效的数据支撑,将传统零售中的导购经验逐渐数字化成可量化和统计的数字指标,能够辅助商家运营,同时帮助用户进行决策。基于这些数据

[计算机视觉论文速递] 2018-04-19

半世苍凉 提交于 2021-02-02 14:46:58
通知:这篇文章有8篇论文速递信息,涉及目标识别、SLAM、3D Model、密集点集配准、立体匹配等方向(含6篇CVPR论文) 目标识别 [1]《Hierarchical Novelty Detection for Visual Object Recognition》 CVPR 2018 Abstract:深度神经网络在具有预定义类别的大规模视觉对象识别任务中取得了令人瞩目的成功。然而,在训练期间识别新类(即未被看见的对象)仍然具有挑战性。在文献中已经讨论了检测这种新类的问题,但是之前大多数工作都是提供简单的二元或回归决策,例如,输出将是“已知的”,“新颖的”或相应的置信区间。在本文中,我们研究更多的基于分层分类框架的信息新颖性检测方案。对于一个新类的对象,我们的目标是在已知类的分层分类中找到它最接近的超类。为此,我们提出了两种不同的方法,称为自顶向下和扁平化方法,以及它们的组合。我们方法的基本组成部分是置信度校正分类器,数据重新标记以及在分层分类法下对新类进行建模的“一次退出”策略。此外,我们的方法可以生成分层嵌入,结合其他常用的语义嵌入,可以提高广义零点学习性能。 arXiv: https://arxiv.org/abs/1804.00722 SLAM [2]《CodeSLAM - Learning a Compact, Optimisable Representation

CocoStuff—基于Deeplab训练数据的标定工具【一、翻译】(未完)

巧了我就是萌 提交于 2021-02-02 08:49:17
一、CocoStuff简介 CocoStuff是一款为deeplab设计的,运行在Matlab中的语义标定工具,其标定结果和结合Deeplab训练出的结果均为mat文件格式,该 项目源码 已在github上进行开源。 二、说明 本文为系列博客第一篇,主要对项目readme进行简单的翻译,主要是为了自己在学习踩坑过程中方便查阅说明,如果能帮到大家便是极好的。 *注:未完,部分只是先扔上来,将来会继续完善。 笔者在探索之前并未在网上搜索到关于CocoStuff的相关中文博客,所以这可能是第一篇,有那里不到位的请多多指教,互相学习。 三、翻译 COCO-Stuff 10K数据集 v1.1(目前已过时) 作者:Holger Caesar, Jasper Uijlings, Vittorio Ferrari 概述 欢迎来到COCO-Stuff数据集的官方主页。COCO-Stuff添加了像素级标定(标注)的流行的COCO数据集,这些标注可以用于一些像语义分割、对象检测和图像字幕的场景理解任务。 ##目录 亮点 更新 成果和未来计划 数据集 语义分割模型 标定工具 Misc(未翻) 亮点 10,000张来自COCO的复杂图像 稠密的像素级标注 91个things类和91个stuff类 实例级标注来自COCO的的数据 物与物的复杂空间环境 每幅coco的图片有5句说明 更新 2017年7月11日

亮点抢先看 | 旷视科技11篇 ICCV 2019 论文概览

流过昼夜 提交于 2021-02-02 02:09:12
点击 我爱计算机视觉 标星,更快获取CVML新技术 本文转载自旷视研究院(megviir)。 ICCV 2019 论文如期发榜,旷视科技共有11篇论文被录取,涵盖通用物体检测及数据集、文字检测与识别、半监督学习、分割算法、视频分析、影像处理、行人及车辆再识别、模型压缩、度量学习、强化学习、元学习等众多领域。 本文把 11 篇论文汇在一起,逐篇做了亮点抢先解读。 1、论文名称: Objects365: A Large-scale, High-quality Dataset for Object Detection 论文链接:暂无 开源链接:https://www.objects365.org/overview.html 关键词:物体检测、数据集 在本文中,我们介绍了一个新的大型物体检测数据集Objects365,它有超过60万张图片,365个类别,超过1000万个高质量的边界框。 由精心设计的三步注释管道手动标记,它是迄今为止最大的物体检测数据集(带有完整注释),并为社区建立了更具挑战性的基准。 Objects365可以作为更好的特征学习数据集,用于目标检测和分割等定位敏感任务。Objects365预训练模型明显优于ImageNet预训练模型:在COCO上训练90K / 540K次迭代时AP提高了5.6(42 vs 36.4)/ 2.7(42 vs 39.3)。 同时