MXNet

未来云原生世界的“领头羊”:容器批量计算项目Volcano 1.0版本发布

Deadly 提交于 2020-08-12 05:33:53
在刚刚结束的CLOUD NATIVE+ OPEN SOURCE Virtual Summit China 2020上,由华为云云原生团队主导的容器批量计算项目Volcano正式发布1.0版本,标志着Volcano项目已经开始走向成熟与稳定。 Volcano项目介绍 Volcano是基于Kubernetes的云原生批量计算引擎,基于华为云在AI、大数据领域的深厚业务积累,补齐了Kubernetes在面向AI、大数据、高性能计算等批量计算任务调度、编排等场景下的短板,向下支持鲲鹏、昇腾、X86等多元算力,向上使能TensorFlow、Spark、华为MindSpore等主流行业计算框架,让数据科学家和算法工程师充分享受到云原生技术所带来的高效计算与极致体验。 Volcano架构示意图 随着Kubernetes作为AI、大数据和高性能批量计算的下一代基础设施的趋势逐渐清晰,越来越多的企业对Kubernetes在深度学习、科学计算、高性能渲染等方面提出了更高的要求。 然而Kubernetes作为普适的容器化解决方案,仍与业务诉求存在一定差距,主要体现在: K8s的原生调度功能无法满足计算要求 K8s作业管理能力无法满足AI训练的复杂诉求 数据管理方面,缺少计算侧数据缓存能力,数据位置感知等功能 资源管理方面缺少分时共享,利用率低 硬件异构能力弱 Volcano的诞生正是基于这些痛点,在调度

GluonCV 0.6: Embrace Video Understanding

女生的网名这么多〃 提交于 2020-08-12 00:06:41
GluonCV 0.6: Embrace Video Understanding Author: Yi Zhu , Applied Scientist at Amazon 视频理解一直是一个趋势性的研究课题,因为分析动态视频可以帮助我们开发更好的计算机视觉算法,从而产生更强的人工智能。然而,视频研究存在着数据量大、实验周期长、缺乏可重复的编码库、缺乏教程、边缘设备部署困难等诸多障碍。 在这个新版本中,GluonCV解决了上述限制。GluonCV现在完全支持最先进的视频分类算法和主要数据集。在发布的同时,我们还提供了新的快速视频阅读器、分布式培训支持、广泛的教程和可复制的基准测试。使用 GluonCV 可以轻松地学习、开发和部署视频理解模型,而不必太担心工程细节。 More Pre-Trained Models and Datasets 最近,FAIR刚刚开放了他们的PySlowFast代码库用于视频理解。与PySlowFast相比,GluonCV提供了对更多模型和数据集的支持。例如,这个版本涵盖了最先进的算法:s TSN , C3D , I3D , P3D , R2+1D , Non-local and SlowFast , 并支持4个最广泛的数据集: UCF101 , HMDB51 , Kinetics400 和 Something-Something-V2 .

Symbol API

泪湿孤枕 提交于 2020-08-11 16:28:42
mxnet的python api主要有两个包: Gluon api 和 Module api 。gluon api容易上手和debug,更加新手友好。因为 gluon主要依赖NDArray包 ,属于交互式编程,类似于python的array。而 Module api主要依赖于Symbol ,由于需要构建symbol graph,是非交互式的,虽不易debug,但是换来了高性能。尽管性能好,但也有一些限制。所以可以利用gluon快速迭代实现,然后转到symbol来更快的训练和推理(当然限制在于可能你的实现symbol无法支持)。 所有模块的API: https://mxnet.apache.org/versions/1.5.0/api/python/index.html Symbol and NDArray? 为何不利用已有的NDArray?NDArray可以像python一样交互式编程,Gluon就是基于NDArray,Gluon使用这种方法(在hybridization之前)允许灵活和可调试的网络。 MXNet提供了另一种符号式编程接口Symbol,需要先构建一个计算图,类似tensorflow,先建立placeholders用于输入和输出,然后编译这个计算图, 通过绑定到NDArrays后实现运行。Gluon也可以通过利用hybridization方法实现这种操作

如何消灭飞机的“黑色十分钟”,AI来帮忙

萝らか妹 提交于 2020-08-10 18:27:58
近年来,“AI的应用和落地”逐渐成了具化的关键词,它和很多事物很多行业结合在一起,形成了奇妙的“化学反应”。例如,在日常生活中,AI可以推送我们喜欢的新闻或视频,可以在拍照的时候识别场景提升照片的美感……. 而今天笔者要说的,可能是从很多人都密切相关但大多很陌生的一个“神秘”的职业说起:机场塔台指挥中心。上海麦图信息科技有限公司,借助华为云ModelArts一站式开发与管理平台,开发出跑道防侵系统。 AI 给了我一双“慧眼” 在机场的每一架飞机起飞或者着陆,从飞机推离停机位到离开机场空域,或相反的降落过程中,背后都需要依靠管制员之间的协作。飞机起降的间隔非常短暂且风险大,有着“黑色十分钟”之说。管制员也被称为是飞行员背后的“眼睛”,对于他们的要求是非常严苛的,需要超长时间集中注意力,尤其在航班密集的时候,管制员需要在极短的时间内对复杂的情况,做出正确判断,这也让管制员们担负着极大的压力。对于普通乘客来说,这可能只是一次普通的空中之旅,但对于管制员来说,每一次飞机起停都伴随着重大责任。 “跑道侵入事件” 是所有管制员们的“噩梦”。飞机起降架次的增多,再加上恶劣天气的影响,跑道侵入事件已成为民航领域航空器地面安全运行的头等问题,跑道安全事故在民用航空事故中也占有很大的比例。然而,随着机场规模和航班密度增加,对于大型机场的塔台而言,单点视野物理受限,数字化程度提升的同时

常用深度学习框——Caffe/ TensorFlow / Keras/ PyTorch/MXNet

梦想与她 提交于 2020-08-10 18:13:16
常用深度学习框——Caffe/ TensorFlow / Keras/ PyTorch/MXNet 一.概述 近几年来,深度学习的研究和应用的热潮持续高涨,各种开源深度学习框架层出不穷,包括TensorFlow,Keras,MXNet,PyTorch,CNTK,Theano,Caffe,DeepLearning4,Lasagne,Neon,等等。Google,Microsoft等商业巨头都加入了这场深度学习框架大战,当下最主流的框架当属TensorFlow,Keras,MXNet,PyTorch,Caffe接下来对这四种主流的深度学习框架从几个不同的方面进行简单的对比。 选择框架,建议几个点考虑: 1)框架能不能解决你的问题。比如某些框架对rnn或者lstm支持不足。 这个是必要条件。下面的都附加条件。 2)框架的资源是否足够。比如文档,社区,开源的项目支持。 3)框架是否易于上手,学习曲线如何。这个就因人而异了。 4)框架应用是否和现有系统匹配。这个也是根据你自己的具体情况了。 二. Caffe Caffe作为入门级的深度学习框架,对于一般的深度学习任务,如图像分类/ 目标检测/ 实例分割等,存在已有的代码供大家参考,使得上手很快,需要新手修改的地方一般为配置文件,基本不需要书写代码。而且Caffe是基于C++的代码,因此训练方面很快。因此,作为新手入门这是一个很好的框架

比GPU性能提升5倍阿里云含光800云服务器正式商用

空扰寡人 提交于 2020-08-09 18:49:31
含光800云服务器,配备阿里平头哥自研神经网络加速芯片含光800,提供全球最高单芯片AI推理性能,有着同类处理器的数十倍性能;并针对业务场景做了深度优化,广泛适用于图像搜索、场景识别、视频内容识别、自然语言处理等业务,为客户提供超高性价比的推理解决方案。 阿里云城市大脑交通信号机系统使用含光800服务器处理车辆检测、品牌识别、车牌识别等算法模型,单张含光800全链路能够支持100路实时视频的分析和特征结构化数据的提取,相比GPU性能提升超过5倍。 阿里电商平台合规经营也在含光800云服务器上建立了多维度全方位的风险识别机制。在同样的算法精度下,性价比是GPU的4倍。 据悉,含光云服务器还基于阿里云自研的神龙云服务器架构,为用户提供弹性裸金属加速实例,兼顾了物理服务器的功能性能优势,以及云计算的高可用优势。开发工具采用阿里平头哥HGAI自动化开发工具,支持主流深度学习框架TensorFlow、Caffe、MXNet和ONNX。 今年3月,阿里云飞天AI加速引擎AIACC与含光800的组合,打败了Google,拿下了斯坦福大学DAWNBench ImageNet推理成本的世界第一,能效比达500IPS/W,是第二名的3.3倍。 AIACC是业界首次统一加速Tensorflow、PyTorch、MXNET、Caffe等主流开源框架的性能加速引擎,AIACC

conda环境管理

南笙酒味 提交于 2020-08-05 01:55:50
查看环境 conda env list 创建环境 conda create -n python36 python=3.6 进入环境 source activate python36 activate python36 # windows下 搜索包 conda search mxnet* 指定环境,查看已安装的包 conda list -n python36 指定环境,安装指定版本的包 conda install -n python36 mxnet==1.0.0 指定环境,更新包 conda update -n python36 mxnet 指定环境,删除包 conda remove -n python36 mxnet 导出环境为yml conda env export > environment.yml 根据yml创建环境 conda env create -f environment.yml 对yml文件修改后更新环境 conda env update -f environment.yml 退出环境 source deactivate deactivate # windows下 复制环境 conda create -n python36 --clone python36_new 删除环境 conda remove -n python36 --all 更改镜像源 conda

Hybrid

本秂侑毒 提交于 2020-07-27 23:20:18
Hybrid - Faster training and easy deployment 相关内容: Fast, portable neural networks with Gluon HybridBlocks A Hybrid of Imperative and Symbolic Programming 深度学习框架大致可以分为两类:declarative和imperative。对于declarative框架(包括Tensorflow、Theano等),用户首先声明一个固定的计算图,然后端到端地执行它。固定计算图的优点是它的可移植性和运行效率。但是,它不太灵活,因为任何逻辑都必须作为特殊运算符(如scan、while_loop和cond)编码到图中。这也很难调试。 imperative框架(包括PyTorch、Chainer等)正好相反:它们像老式的Matlab和Numpy一样逐个执行命令。这种风格更灵活,更容易调试,但效率较低。 HybridBlock无缝地结合了声明式编程和命令式编程,从而提供了两者的优点。用户可以通过命令式编程快速开发和调试模型,并通过调用以下命令切换到高效的声明式执行: HybridBlock.hybridize() . HybridBlock HybridBlock类似于Block但是有一些限制:

How to increase validation accuracy with deep neural net?

耗尽温柔 提交于 2020-05-24 08:23:41
问题 I am trying to build a 11 class image classifier with 13000 training images and 3000 validation images. I am using deep neural network which is being trained using mxnet. Training accuracy is increasing and reached above 80% but validation accuracy is coming in range of 54-57% and its not increasing. What can be the issue here? Should I increase the no of images? 回答1: The issue here is that your network stop learning useful general features at some point and start adapting to peculiarities of

目标检测论文阅读:Deformable Convolutional Networks

五迷三道 提交于 2020-04-25 06:40:59
https://blog.csdn.net/qq_21949357/article/details/80538255 这篇论文其实读起来还是比较难懂的,主要是细节部分很需要推敲,尤其是deformable的卷积如何实现的一步上,在写这篇博客之前,我也查阅了很多其他人的分享或者去github找代码,当然也不敢说完全了解了这种特殊的卷积……仅仅做一点自己的阅读心得与体会吧。这是一篇很有意义的工作,但是和深度学习很多论文一样,在读完之后内心也不免有着种种疑云。 Deformable Convolutional Networks 论文链接:https://arxiv.org/abs/1703.06211 代码链接:https://github.com/msracver/Deformable-ConvNets(官方实现,但是release的版本是迁移到MXNet上的,速度和performance上有些出入) MSRA的文章,严格意义上讲,deformable convolutional不仅仅只适用于object detection,作为对常见的卷积的一种改良,它可以广泛应用在各个网络中,和空洞卷积一样,是对传统卷积的改良,而且某种意义上也可以说是空洞卷积的进一步拓展。 1. Background 这篇文章的motivation其实比较简单,我们都知道,常规的卷积,包括池化这些操作