Ubuntu18.04中布署CUDA10.1 + CUDNN7.6.1 + Tensorflow-gpu深度学习环境

試著忘記壹切 提交于 2019-12-04 14:56:38

  在配置Tensorflow环境过程中,由于版本和驱动不对应,导致调试时一直报错,请后续者在配置前,务必参看CUDA和CUDNN与Tensorflow的对应关系后再动手,避免不必要的时间浪费。本文系统环境是Ubuntu18.04,显卡是GeForce GTX960M。链接2在较新的硬件安装时用,可大辐节省时间。

本文参考链接1:https://blog.csdn.net/BigData_Mining/article/details/99670642

本文参考链接2:https://www.cnblogs.com/ManWingloeng/p/11489122.html

一、安装N卡驱动:

  1,查看N卡信息。

1 nvidia-smi

  2,删除旧版N卡驱动。

1 sudo apt-get remove nvidia-*
2 sudo apt-get autoremove

  3,获取系统推荐驱动(括号带recommended的),并安装该驱动,我的是440。

1 ubuntu-drivers devices
1 sudo apt-get install nvidia-settings nvidia-driver-440 nvidia-prime

  4,重启。

1 sudo reboot

 

二、安装CUDA10.1及CUDNN7.6.1

  1,查看适合本机的CUDA及CUDNN版本。

1 cat /usr/local/cuda/version.txt
1 cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

 

  2,安装CUDA。在http://developer.nvidia.com/cuda-downloads下载安装deb包安装,或直接通过其下介绍的Base Installer方式安装,我这边选了官网的方式。

1 wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
2 sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
3 wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda-repo-ubuntu1804-10-1-local-10.1.243-418.87.00_1.0-1_amd64.deb
4 sudo dpkg -i cuda-repo-ubuntu1804-10-1-local-10.1.243-418.87.00_1.0-1_amd64.deb
5 sudo apt-key add /var/cuda-repo-10-1-local-10.1.243-418.87.00/7fa2af80.pub
6 sudo apt-get update
7 sudo apt-get -y install cuda

  3,安装CUDNN。通过https://developer.nvidia.com/rdp/cudnn-archive下载对应的CUDNN压缩文件,解压获得文件夹cuda,将其整个复制到系统主目录home下。

  4,设置环境变量(设置前要安装好Vim)。

 

1 vi ~/.bashrc

 

输入如上命令打开bashrc,按字母I键进行输入模式,在最后面加入如下内容,按ESC键后,按shft+:,输入wq保存并退出。

1 export PATH="/usr/local/cuda/bin:$PATH"
2 export LD_LIBRARY_PATH="/usr/lcoal/cuda/lib64:$LD_LIBRARY_PATH"

  5,使设置生效。

1 source ~/.bashrc

 

三、通过pip安装Tensorflow-gpu。

1 sudo pip install tensorflow-gpu

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!