Ubuntu 18.04 + NVIDIA Driver 410.104 + CUDA 10.0 + cudnn 7.5.0从零搭建深度学习环境

◇◆丶佛笑我妖孽 提交于 2019-12-10 17:42:45

在成功安装OpenPose(windows 10)后,去查看了MMSkeleton的官方安装文档,requirements上显示:“Windows is not officially supported”
所以为了确保万无一失,我在一台电脑上安装了ubuntu系统,重头开始配置环境。
这篇博客详细记录了如何在Ubuntu上从零开始搭建各种环境。
软硬件环境:
python 3.6.5
Ubuntu 18.04 LTS
NVIDIA TITAN XP

0. 换源问题

(1)安装Anaconda镜像

conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes

(2)更新pip源

 mkdir ~/.pip
 sudo gedit ~/.pip/pip.conf

添加以下代码到pip.conf

[global]
trusted-host=mirrors.aliyun.com
Index-url=https://mirrors.aliyun.com/pypi/simple/

1. 下载Anaconda

我下载的是Anaconda3-5.3.1-Linux-x86_64.sh版本,还有其他版本供选择。
之后cd到下载软件的文件夹内,输入以下命令:

bash Anaconda3-5.3.1-Linux-x86_64.sh

一路按“Enter”就行了,最后问是否安装VSCode,选择“No”,安装完毕,输入下列代码,注意,这一步一定要有

source ~/.bashrc

再输入python3,检查以下是否是新版本的python:

python3

在这里插入图片描述

2. 安装Pycharm

我选择第二部安装Pycharm,先去官网下载Pycharm。点击Download进入下载页面,下载Community即可。找到下载好的压缩包,解压。
进入Pycharm-bin,右键“在终端打开”,

sudo ./pycharm.sh

1)输入自己的密码,“Do not import settings”
在这里插入图片描述
2)
在这里插入图片描述
3)按自己喜欢的颜色选一个合适的风格
在这里插入图片描述
4)将图标固定到收藏夹。我安装完毕pycharm后,右键没有出现“固定到收藏夹”,所以我新建一个项目,
点击tools-create Desktop Entry
之后关闭pycharm,在终端再次输入pycharm.sh,打开
再右击pycharm图标,就有这个选项了。

3. 安装NVIDIA驱动(重重重要!!)

ubuntu自带的驱动是nouveau,nouveau开源驱动性能很低。所以千万不要用ubuntu附加驱动提供的显卡驱动!NVIDIA显卡驱动的安装真的太容易踩坑(导致我重装系统很多次),很多童鞋都是死在安装显卡驱动上。每个人安装的时候遇到的问题都不大一样,能不能安装好跟运气好像也有点关系(嘻嘻)。这里就不仔细写自己的安装过程了,如果有疑问可以私信我,因为我感觉该遇到的问题我都遇到了,基本重装了3次系统才解决这一步。
可以参考
在这里插入图片描述

4. 安装CUDA cudnn

先查一下NVIDIA驱动和CUDA的对应关系,因为我安装的是410.104的版本,对应就安装CUDA10.0
再查一下CUDA cudnn对应的关系,我选择cudnn7.5.0。
其中安装CUDA的时候会出现下面的一个安装过程,具体的选项就是除了问是否安装驱动的时候选择 no 其他都选yes或者按enter键。
在这里插入图片描述最后在终端输入nvcc -V显示:
在这里插入图片描述
就成功了安装CUDA了,显示如下,就成功安装cudnn了:
在这里插入图片描述

在这里说几个注意事项!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

  1. 安装CUDA的时候,在输入sudo gedit ~/.bashrc之后,如果出现了空白页面,就关闭重新来,一定要出现以下这样的页面,否则输入nvcc -V会提示错误。
    在这里插入图片描述

5. 安装tensorflow

记得查询CUDA cudnn和tensorflow的对应版本,我选择安装1.14.0版本的tensorflow-gpu
具体过程:

  1. 创建tensorflow-gpu的虚拟环境conda create -n tf-gpu python=3.6
  2. 激活环境source activate tf-gpu
  3. 安装tensorflow-gpu$ conda install --channel https://conda.anaconda.org/jjh_ppc64le tensorflow-gpu=1.14.0
  4. 检查是否安装成功:
python
import tensorflow as tf
tf.__version__

我在这过程中遇到一个问题:出现了很多Future Warning:
“FutureWarning: Passing (type, 1) or ‘1type’ as a synonym of type is deprecated; in a future version of numpy, it will be understood as (type, (1,)) / ‘(1,)type’.
_np_quint8 = np.dtype([(“quint8”, np.uint8, 1)])”
【解决办法】将numpy删除,重新安装1.16.0的版本,顺利解决。

pip uninstall numpy
pip install numpy==1.16.0

(注意一下) 如果安装虚拟环境过程中出现问题,解决不了,可以把虚拟环境删除conda remove -n tf-gpu --all

6. 安装PyTorch

先去下载PyTorch,
然后在安装包所在的文件夹下打开终端运行以下命令

pip install torch-1.1.0-cp36-cp36m-linux_x86_64.whl
pip install torchvision-0.3.0-cp36-cp36m-linux_x86_64.whl

看到successfully installed就行了,警告没装mksg还是啥的不用它,之后检测是否安装成功:

python
import torch
torch.__version__   #'1.1.0'
torch.cuda.is_available()   !'True'

7. 安装mxnet

找到安装包位置打开终端

pip install mxnet_cu100-1.4.1-py2.py3-none-manylinux1_x86_64.whl

8. 安装WPS

找到安装包位置打开终端:

sudo dpkg -i wps-office_10.1.0.6634_amd64.deb

9. 安装ibus(汉语拼音输入法)

参考https://blog.csdn.net/wu10188/article/details/86540464
第三步再键盘input sources中按了+,但是没有chinese选项的时候,重启电脑,就能解决。

希望对大家有帮助!!!

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!