英伟达

Nvidia-Docker安装使用 -- 可使用GPU的Docker容器

◇◆丶佛笑我妖孽 提交于 2019-12-04 08:29:19
nvidia-docker 是一个可以使用 GPU 的 docker , nvidia-docker 是在 docker 上做了一层封装,通过 nvidia-docker-plugin ,然后调用到 docker 上,其最终实现的还是在 docker 的启动命令上携带一些必要的参数。因此在安装 nvidia-docker 之前,还是需要安装 docker 的。 docker 一般都是使用基于 CPU 的应用,而如果是 GPU 的话,就需要安装特有的硬件环境,比如需要安装 nvidia driver 。所以 docker 容器并不直接支持 Nvidia GPU 。为了解决这个问题,最早的处理办法是在容器内部,全部重新安装 nvidia driver ,然后通过设置相应的设备参数来启动 container ,然而这种办法是很脆弱的。因为宿主机的 driver 的版本必须完全匹配容器内的 driver 版本,这样导致 docker image 无法共享,很可能本地机器的不一致导致每台机器都需要去重复操作,这很大的违背了 docker 的设计之初。 为了使 docker image 能很便利的使用 Nvidia GPU ,从而产生了 nvidia-docker ,由它来制作 nvidia driver 的 image ,这就要求在目标机器上启动 container 时

机器翻译Transformer实战:利用nvidia-docker和Tensorflow Serving快速部署一个基于Tensor2Tensor的神经机器翻译服务

假如想象 提交于 2019-12-04 03:48:22
Docker目前也只是跑通,能进行基本的使用。 如果有需求,还可以使用Docker GPU版本,可以使用GPU。 以GPU版本为例: 卸载原有的Docker sudo apt-get remove docker sudo apt-get remove docker-ce sudo apt-get remove docker docker-engine docker.io containerd runc 本机环境 nvidia驱动:最新版 Ubuntu16.04 Python3.6 Tensor2Tensor 1.9 #不要下载最新版,只支持TF1.13.0 Tensorflow 1.12.0 #(可不安装) Tensorflow-gpu 1.12.0 CUDA 9.0.176 cudnn 7.0.5 pip3 最新版 Tensorflow安装(默认已安装好对应的CUDA和cudnn版本) sudo pip3 install tensorflow==1.12 #(可不安装) sudo pip3 install tensorflow-gpu==1.12 #GPU版本 #可以使用清华源进行安装,满速下载 sudo pip3 install tensorflow-gpu==1.12.0 -i https://pypi.tuna.tsinghua.edu.cn/simple #可改成任意版本

cuda-cudnn

会有一股神秘感。 提交于 2019-12-03 20:27:00
查看服务器GPU信息 Linux查看显卡信息,gpu型号: lspci | grep -i vga 17:00.0 VGA compatible controller: NVIDIA Corporation Device 1e04 (rev a1) 65:00.0 VGA compatible controller: NVIDIA Corporation Device 1e04 (rev a1) lspci -v -s 17:00.0 17:00.0 VGA compatible controller: NVIDIA Corporation Device 1e04 (rev a1) (prog-if 00 [VGA controller]) Subsystem: ZOTAC International (MCO) Ltd. Device 2503 Flags: bus master, fast devsel, latency 0, IRQ 68, NUMA node 0 Memory at b4000000 (32-bit, non-prefetchable) [size=16M] Memory at 380060000000 (64-bit, prefetchable) [size=256M] Memory at 380070000000 (64-bit,

Centos安装Nvidia驱动、Cuda、Cudnn、TF2.0

被刻印的时光 ゝ 提交于 2019-12-03 20:14:08
Centos安装Nvidia驱动、Cuda、Cudnn、TF2.0 1、安装Nvidia驱动 本人的服务器上以前安装好了Nvidia驱动,此次是在原有基础上进行操作的,相当于更新驱动。 若是 从头开始安装 需要参考这个教程: https://blog.csdn.net/xueshengke/article/details/78134991 如果是进行更新,需要先卸载之前的版本。 sudo ./NVIDIA-Linux-x86-310.19.run --uninstall 首先需要下载号对应版本的驱动: https://www.geforce.cn/drivers 在上面这个网站下载好驱动后,在进行下一步 接下来将文档发送远程服务器上,可以使用Xftp发送到指定目录(可以随便指定)。 切换到驱动文件所在目录再输入如下指令进行安装: chmod +x NVIDIA-Linux-x86_64-440.31.run ./NVIDIA-Linux-x86_64-440.31.run 然后等待读取进度。 本人在安装的过程中遇到了如下错误: unable to find the kernel source tree for current running kernel 出现这个错误的原因在于: 当前运行的linux kernel版本与kernel-devel和kernel

Kubernetes管理GPU应用

随声附和 提交于 2019-12-03 14:53:59
目录 简介 GPU驱动 Nvidia-docker Nvidia-device-plugin 在Kubernetes上运行GPU应用 附录 简介 伴随着人工智能技术的发展,机器学习的应用场景越来越广泛 深度学习的实现,需要多种技术进行支撑,比如服务器、GPU、集群、集群管理调度软件、深度学习框架、深度学习的具体应用等 随着Kubernetes的兴起,越来越多的训练任务也都直接运行在Kubernetes之上,这些基于GPU的应用也为Kubernetes的应用管理带了一定的挑战 我也一直在致力于推动公司业务上容器,本篇文档我们就来聊一聊在Kubernetes上如何管理GPU应用。 GPU驱动 要管理GPU应用,首先要解决的自然就是GPU的驱动。 首先我们得有一台带有gpu的服务器。可通过如下指令查询gpu型号(我这里以nvidia为例): # lspci |grep -i nvidia 00:08.0 3D controller: NVIDIA Corporation GP104GL [Tesla P4] (rev a1) 上面显示这台机器有一块nvidia的显卡,型号为Tesla P4,可以通过下面的指令查看更详细的信息: # lspci -v -s 00:08.0 00:08.0 3D controller: NVIDIA Corporation GP104GL [Tesla P4

win10 + python3.6 + tensorflow-gpu 1.8 下安装 CUDA9.0 +CUDNN7.1.4

ぃ、小莉子 提交于 2019-12-03 08:32:57
1.使用anaconda创建tensorflow环境,我的笔记本有块gtx 765显卡,所以使用的是tensorflow gpu,并更新到1.8版本 2.官网更新最新显卡驱动,安装cuda9.0 CUDA是NVIDIA推出的运算平台,tensorflow-gpu版运行必须需要该环境,目前支持9.0(似乎9.1也支持),下载地址: https://developer.nvidia.com/cuda-90-download-archive?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exelocal 精简安装即可 3.官网已经更新到7.2,目前只下载cudnn 7.1版本,需要注册账号,地址: https://developer.nvidia.com/rdp/cudnn-archive 解压后复制到CUDA的目录:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0 直接把解压后的所有文件复制过去合并就可以(文件夹下的文件复制过去,不要复制文件夹): 4.验证下 在命令行中运行C:\Program Files\NVIDIA Corporation\NVSMI\nvidia-smi.exe,可以得到GPU运行时的监测界面,则CUDA安装成功

Linux下CUDA9.0+CUDNN7.0+Tensorflow1.8.0安装详解

喜夏-厌秋 提交于 2019-12-03 08:32:04
Linux下CUDA9.0+CUDNN7.0+Tensorflow1.8.0安装详解 NVIDIA驱动安装 nouveau驱动去除 vim /etc/modprobe.d/blacklist-nouveau.conf在其中添加如下信息: blacklist nouveau options nouveau modeset=0 执行如下命令使其生效 sudo update-initramfs -u 查看是否成功去除nouveau驱动 lsmod | grep nouveau 执行上述命令,什么都不显示说明已经成功去除了nouveau驱动 检查GPU是否识别 lspci | grep NV 显示结果:84:00.0 3D controller: NVIDIA Corporation Device 1bb3 (rev a1) 查看显卡信息 nvidia-smi 执行结果如下: 下载对应驱动 对应网址: https://www.nvidia.cn/Download/index.aspx?lang=cn 下载对应类型: 下载后文件为:NVIDIA-Linux-x86_64-384.145.run 安装 NVIDIA-Linux-x86_64-384.145.run,一路ok即可。 CUDA9.0安装 下载 对应网址: https://developer.nvidia.com/cuda

Win10+Python 3.6环境下cuda 9.1+cuDNN 7.1+Tensorflow 1.7+keras安装

允我心安 提交于 2019-12-03 08:24:29
安装环境: windows 10 64bit python 3.6 安装以下步骤进行安装: 更新GPU驱动—>安装cuda—>安装cuDNN—>安装Tensorflow—>安装keras 1、更新GPU驱动 首先查看机器的GPU型号,查看其是否支持cuda,在Nvidia官网下载对应的最新驱动进行跟新。这一步应该很简单,就不多说了。 2、安装cuda Tensorflow已经更新到1.7版本了,官网上说支持最新的cuda 9.X和cuDNN 7.X(结果被坑,后期详述),在Nvidia官网上下载最新的cuda和cuDNN。 cuda 9.1 下载地址: https://developer.nvidia.com/cuda-downloads cuDNN 7.1.2 下载地址: https://developer.nvidia.com/rdp/cudnn-download 注意:下载cuDNN需要注册用户,同时下载cuDNN版本时要对应cuda下载的版本,否则运行程序的时候会报错。这里选择v7.1.2 for cuda 9.1的win10版本。 安装包下载好之后,安装cuda(需要管理员权限),按照安装程序一步一步进行下去即可。安装完成后,在cmd输入nvcc -V查看cuda是否安装成功。 3、安装cuDNN 解压缩下载的cuDNN安装包,得到以下三个文件夹 将其复制在C:

【深度学习笔记】tensorflow-gpu1.13 + Win10 + CUDA10.1 + CUDNN7.5.0 + Python3.7 + VS2019安装

不羁岁月 提交于 2019-12-03 08:23:23
目 录 1 准备工作 1.1 (坑一)确认电脑上没有安装tensorflow的CPU版本,有的话要先卸载 1.2 (坑二)更新自己的显卡驱动 1.3 查看python版本 1.4 查看GPU版本 1.5 查看Tensorflow版本 1.6 查看版本支持 2 安装CUDA Toolkit 10.1 3 安装cuDNN v7.5.0 (Feb 25, 2019), for CUDA 10.1 4 配置环境变量 5 安装tensorflow1.13(with Anaconda) 6 直接安装tensorflow(without Anaconda) 6.1 查看CPU的指令集 6.2 下载对应版本的tf 6.3 安装tensorflow 7 试用Tensorflow-gpu 7.1 测试1 7.2 直接在jupyter中测试tensorflow-gpu 1 准备工作 Win10上搭建TensorFlow的开发环境需要至少需要安装3个软件,分别为:1.python,2.CUDA和CuDNN,3.TensorFlow(GPU版)。安装前一定要确认好每个软件的版本是否相互支持。 1.1(坑一)确认电脑上没有安装tensorflow的CPU版本,有的话要先卸载 1.2(坑二)更新自己的显卡驱动 因为刚刚重装了电脑发现显卡驱动竟然丢了,那还怎么用GPU,赶紧到官网下载最新的,否则会报错

(2018最新)win10+CUDA9.0+cudnn7.1.4+TensorFlow1.8.0安装

a 夏天 提交于 2019-12-03 08:23:13
【时间】2018.11.30 【题目】win10+CUDA9.0+cudnn7.1.4+TensorFlow1.8.0安装 概述 本文主要讲述了win10+CUDA9.0+cudnn7.1+TensorFlow1.8.0安装。下面是官方教程,是英文版的。 CUDA: https://docs.nvidia.com/cuda/cuda-installation-guide-microsoft-windows/index.html cuDNN: https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html#installwindows CUDA9.0+cudnn7.1.4 下载链接 :链接: https://pan.baidu.com/s/1C56ubJn1PTFYGTlYgRsemA 提取码:10fb 一、安装的各个版本 tensorflow 1.8.0 下载地址: CUDA9.0: https://developer.nvidia.com/cuda-toolkit-archive 【注意】本人在下载 exe(local)版本时,总是在最后的时候下载失败,所以最后选择了下载exe(network)版本,只有十几M。 cudnn7.1.4: https://developer.nvidia.com/rdp/cudnn