Ubuntu 18.04 + NVIDIA Driver 418 + CUDA 10.0 + cuDNN 7.6
之前安装了 NVIDIA-Linux-x86_64-440.36.run ,之后发现440驱动只能安装cuda10.2,但是TensorFlow和pytorch都仅支持到10.1,不得不重装。。。还是老版本的好。
硬件及系统环境
- NVIDIA GeForce RTX 2080 Ti * 4
- Ubuntu 18.04
- NVIDIA Driver 418
- CUDA Toolkit 10.0
- CuDNN 7.6
安装NVIDIA Driver 418
如果之前像我一样一件安装过驱动,需要卸载显卡驱动
sudo apt-get remove --purge nvidia-\*
安装gcc和g++
sudo apt-get install gcc g++ make
添加NVIDIA软件包存储库
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
sudo apt-get update
wget http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
sudo apt install ./nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
sudo apt-get update
安装NVIDIA驱动程序
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-driver-418
安装CUDA 10.0和cuDNN 7.6
这一部分和我之前写的博客Ubuntu18.04安装TensorFlow-gpu 2.0一样。
出现的问题
目前电脑配置是4块2080Ti,每次运行代码就会提示:
Unable to determine the device handle for GPU 0000:19:00.0: GPU is lost. Reboot the system to recover this GPU
一开始以为是环境配置的问题,重新配置几次依然还是同样的问题,之后发现是其他硬件带不动4块显卡,拔下来一块就可正常运行了,具体是什么哪个硬件的问题目前还不清楚。
来源:CSDN
作者:dl_None
链接:https://blog.csdn.net/Coding_1995/article/details/103665990