安装环境
centos7.3的64位版本,安装时选择的workstation选项进行的安装。cuda环境是9.2。
安装过程
安装版本选择
一开始安装的时候选择的是最新的cuda10.2套件,进行安装时候出现了很多错误,使用离线的run文件运行,在进行第一步的显卡驱动安装的时候就会失败,错误退出码是256,查询未果。又尝试使用了离线的rpm文件进行安装,完全按着文件下载页的安装步骤来,到第三步的时候就会提示安装包冲突,放弃。又尝试了使用在线的rpm包进行安装,安装过程中下载了一堆rpm包,这次倒是显示安装完了,但是执行nvidia-smi命令没有反应,放弃。。。仔细看了cuda10.2的安装文档,发现cuda10.2需要centos7.7的操作系统才能安装。
准备工作
整个cuda的安装过程总体说很简单,选择的时候一路y和默认下来就可以。比较复杂的是安装前的准备工作:设置系统以命令行模式启动(关掉图形界面),禁用系统自带的nouveau驱动。
-
设置系统以命令行启动 临时设置一次命令行模式启动:
init 3
将系统默认启动模式都设置为命令行模式启动,需要设置系统参数:systemctl set-default multi-user.target
-
禁用nouveau系统驱动 首先可以使用命令
lsmod |grep nouveau
查看是否有程序依赖运行nouveau驱动,如果没任何结果显示,那么本节可以不用再看了,如果有结果,那么需要去做一些修改去禁用nouveau的启动:1. 首先在文件 /etc/modprobe.d/blacklist.conf下追加一下内容
blacklist nouveau
options nouveau modeset=0
保存后退出。 2.修改镜像文件,首选对文件备份一下:mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
,然后再去修改:dracut /boot/initramfs-$(uname -r).img $(uname -r)
。3.重启系统生效,并用命令lsmod | grep nouveau
确认一下已经成功的禁用了nouveau。
开始执行安装
root用户执行命令sh XXX.run
,安装过程总体说很简单,选择的时候一路y和默认下来就可以。值得注意的是,如果在询问是否安装opengl库的时候,你选了y,但是你的系统中已经安装了opengl库,那么安装的时候可能会失败,并且失败的信息显示的是无法确定kernel-source的位置,并让传递个参数,这个信息不准确,需要看一下驱动安装的log文件,查看具体的问题。就本文提到的这个情况,可以把系统原有的opengl库删除(结合yum list和yum remove命令来删除)的方法来解决(已验证)或者在安装的时候当询问是否安装opengl的时候输入n(猜测,未验证)。
安装完成的后续操作
设置环境变量:将cuda的安装目录下的bin目录添加到PATH环境变量中,将cuda的安装目录下的lib64添加到LD_LIBRARY_PATH环境变量中。如果希望对所有的用户生效,则将上述修改添加到/etc/profile中,如果只希望对某个用户起作用,那么将上述修改写入到改用户家目录下的.bash_profile或者.bashrc中。
来源:oschina
链接:https://my.oschina.net/u/4489002/blog/3227877