Centos安装Nvidia驱动、Cuda、Cudnn、TF2.0
1、安装Nvidia驱动
本人的服务器上以前安装好了Nvidia驱动,此次是在原有基础上进行操作的,相当于更新驱动。
若是从头开始安装需要参考这个教程:https://blog.csdn.net/xueshengke/article/details/78134991
如果是进行更新,需要先卸载之前的版本。
sudo ./NVIDIA-Linux-x86-310.19.run --uninstall
首先需要下载号对应版本的驱动:
https://www.geforce.cn/drivers
在上面这个网站下载好驱动后,在进行下一步
接下来将文档发送远程服务器上,可以使用Xftp发送到指定目录(可以随便指定)。
切换到驱动文件所在目录再输入如下指令进行安装:
chmod +x NVIDIA-Linux-x86_64-440.31.run ./NVIDIA-Linux-x86_64-440.31.run
然后等待读取进度。
本人在安装的过程中遇到了如下错误:
unable to find the kernel source tree for current running kernel
出现这个错误的原因在于:当前运行的linux kernel版本与kernel-devel和kernel-headers的版本不一致。需要通过更新使其一致。
这个错误可以参考:https://blog.csdn.net/haixwang/article/details/90408538
上述博客中提到的网站可能找不到所需的kernel-devel和kernel-headers版本。可以从下面这个网站中寻找:http://rpm.pbone.net/
解决这个问题后就可以顺利进行安装了。
关于安装选项:
dkms 安装最好 选yes
32位兼容 安装最好 选yes
x-org 最好别安,选no,有的电脑可能导致登录界面黑屏
安装完后输入指令进行验证:nvidia-smi
2、安装Cuda
安装Cuda推荐使用conda进行安装。
输入如下指令即可进行安装:
conda install cudatoolkit=10.0 conda install cudnn=7.6
注意:在tensorflow2.0中暂时不支持(cuda10.1--2019.11.6测试)。所以需要安装cuda10.0。
若使用cuda10.1则会报错。
Cannot dlopen some GPU libraries. Please make sure the missing libraries mentioned above are installed properly if you would like to use GPU. Follow the guide at https://www.tensorflow.org/install/gpu for how to download and setup the required libraries for your platform.
3、安装TF2.0
使用conda安装CPU版本。
conda install tensorflow=2.0
TF2.0 GPU版本使用conda安装会报错,需要使用pip命令来安装。
pip install tensorflow-gpu
安装完成后,需要进行测试。输入如下指令:
python
先输入以上指令进入python解释器,在输入下面的指令。
from __future__ import absolute_import, division, print_function, unicode_literals import tensorflow as tf print("Num GPUs Available: ", len(tf.config.experimental.list_physical_devices('GPU')))
若是结果等于0,则代表没安装好GPU版本。