在配置Tensorflow环境过程中,由于版本和驱动不对应,导致调试时一直报错,请后续者在配置前,务必参看CUDA和CUDNN与Tensorflow的对应关系后再动手,避免不必要的时间浪费。本文系统环境是Ubuntu18.04,显卡是GeForce GTX960M。链接2在较新的硬件安装时用,可大辐节省时间。
本文参考链接1:https://blog.csdn.net/BigData_Mining/article/details/99670642
本文参考链接2:https://www.cnblogs.com/ManWingloeng/p/11489122.html
一、安装N卡驱动:
1,查看N卡信息。
1 nvidia-smi
2,删除旧版N卡驱动。
1 sudo apt-get remove nvidia-* 2 sudo apt-get autoremove
3,获取系统推荐驱动(括号带recommended的),并安装该驱动,我的是440。
1 ubuntu-drivers devices
1 sudo apt-get install nvidia-settings nvidia-driver-440 nvidia-prime
4,重启。
1 sudo reboot
二、安装CUDA10.1及CUDNN7.6.1
1,查看适合本机的CUDA及CUDNN版本。
1 cat /usr/local/cuda/version.txt
1 cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
2,安装CUDA。在http://developer.nvidia.com/cuda-downloads下载安装deb包安装,或直接通过其下介绍的Base Installer方式安装,我这边选了官网的方式。
1 wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin 2 sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600 3 wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda-repo-ubuntu1804-10-1-local-10.1.243-418.87.00_1.0-1_amd64.deb 4 sudo dpkg -i cuda-repo-ubuntu1804-10-1-local-10.1.243-418.87.00_1.0-1_amd64.deb 5 sudo apt-key add /var/cuda-repo-10-1-local-10.1.243-418.87.00/7fa2af80.pub 6 sudo apt-get update 7 sudo apt-get -y install cuda
3,安装CUDNN。通过https://developer.nvidia.com/rdp/cudnn-archive下载对应的CUDNN压缩文件,解压获得文件夹cuda,将其整个复制到系统主目录home下。
4,设置环境变量(设置前要安装好Vim)。
1 vi ~/.bashrc
输入如上命令打开bashrc,按字母I键进行输入模式,在最后面加入如下内容,按ESC键后,按shft+:,输入wq保存并退出。
1 export PATH="/usr/local/cuda/bin:$PATH" 2 export LD_LIBRARY_PATH="/usr/lcoal/cuda/lib64:$LD_LIBRARY_PATH"
5,使设置生效。
1 source ~/.bashrc
三、通过pip安装Tensorflow-gpu。
1 sudo pip install tensorflow-gpu