Centos安装Nvidia驱动、Cuda、Cudnn、TF2.0

被刻印的时光 ゝ 提交于 2019-12-03 20:14:08

Centos安装Nvidia驱动、Cuda、Cudnn、TF2.0

1、安装Nvidia驱动

本人的服务器上以前安装好了Nvidia驱动,此次是在原有基础上进行操作的,相当于更新驱动。

若是从头开始安装需要参考这个教程:https://blog.csdn.net/xueshengke/article/details/78134991


如果是进行更新,需要先卸载之前的版本。

sudo ./NVIDIA-Linux-x86-310.19.run --uninstall

首先需要下载号对应版本的驱动:
https://www.geforce.cn/drivers
在上面这个网站下载好驱动后,在进行下一步

接下来将文档发送远程服务器上,可以使用Xftp发送到指定目录(可以随便指定)。

切换到驱动文件所在目录再输入如下指令进行安装:

chmod +x NVIDIA-Linux-x86_64-440.31.run
./NVIDIA-Linux-x86_64-440.31.run

然后等待读取进度。

本人在安装的过程中遇到了如下错误:

unable to find the kernel source tree for current running kernel

出现这个错误的原因在于:当前运行的linux kernel版本与kernel-devel和kernel-headers的版本不一致。需要通过更新使其一致。
这个错误可以参考:https://blog.csdn.net/haixwang/article/details/90408538

上述博客中提到的网站可能找不到所需的kernel-devel和kernel-headers版本。可以从下面这个网站中寻找:http://rpm.pbone.net/

解决这个问题后就可以顺利进行安装了。

关于安装选项:

dkms 安装最好 选yes
32位兼容 安装最好 选yes
x-org 最好别安,选no,有的电脑可能导致登录界面黑屏

安装完后输入指令进行验证:nvidia-smi

2、安装Cuda

安装Cuda推荐使用conda进行安装。
输入如下指令即可进行安装:

conda install cudatoolkit=10.0
conda install cudnn=7.6

注意:在tensorflow2.0中暂时不支持(cuda10.1--2019.11.6测试)。所以需要安装cuda10.0。
若使用cuda10.1则会报错。

Cannot dlopen some GPU libraries. Please make sure the missing libraries mentioned above are installed properly if you would like to use GPU. Follow the guide at https://www.tensorflow.org/install/gpu for how to download and setup the required libraries for your platform.

3、安装TF2.0

使用conda安装CPU版本。

conda install tensorflow=2.0

TF2.0 GPU版本使用conda安装会报错,需要使用pip命令来安装。

pip install tensorflow-gpu

安装完成后,需要进行测试。输入如下指令:

python

先输入以上指令进入python解释器,在输入下面的指令。

from __future__ import absolute_import, division, print_function, unicode_literals

import tensorflow as tf
print("Num GPUs Available: ", len(tf.config.experimental.list_physical_devices('GPU')))

若是结果等于0,则代表没安装好GPU版本。

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!