cudnn

在windows上极简安装GPU版AI框架

≯℡__Kan透↙ 提交于 2020-03-07 22:22:10
在windows上极简安装GPU版AI框架 如果我们想在windows系统上安装GPU版本的AI框架,比如GPU版本的tesnorflow,通常我们会看到类似下面的安装教程 官方版本 安装CUDA 安装cuDNN 配置环境变量 安装python环境 安装gpu版的tensorflow开发包 咋看上去好像不是很复杂,但是其中坑多到你怀疑人生。 下载的cuDNN时候需要注册,而且因为cuDNN文件在外网,下载速度很慢。 比如不同版本的tensorflow和CUDA(cuDNN)的版本是有匹配关系的,那你可能会说我先查好他们的这个依赖关系,然后找好合适的版本再安装。 比如对于windows系统而言,显卡驱动的版本决定了你能够安装的CUDA版本,有部分教程会忽略这一点。 ...... 假如你幸运地把上面的这些坑全部趟过了,那你还可能会遇到一个问题,就是如果你用pip去安装tensorflow-gpu,还是有可能会报各种神奇的错误。事实上,在windows系统上安装AI框架,最好的方法是用conda,而不是用原生的pip。 总结了上面的这些常见的问题,下面我们开始介绍如何在windows上极简安装GPU版AI框架: 极简版本 安装Anaconda 新建conda虚拟环境(建议用python3.6,可换国内源) 安装显卡驱动(官网下载或者用驱动助手软件)

神经网络学习小记录42——windows下的tensorflow-gpu=1.13.2环境配置

北慕城南 提交于 2020-03-07 05:24:49
神经网络学习小记录42——windows下的tensorflow-gpu=1.13.2环境配置 学习前言 环境内容 Anaconda安装 下载Cudnn和CUDA 配置tensorflow环境 安装VSCODE 学习前言 好多人问环境怎么配置,还是出个教程吧。 环境内容 tensorflow-gpu:1.13.2 keras:2.1.5 numpy:1.17.4 Anaconda安装 取网上搜索Anaconda的官网: https://www.anaconda.com/distribution/ 下载左边的python3.7版本,64位的,下载完成后打开: 选择安装的位置,可以不安装在C盘。 我选择了Add Anaconda to my PATH environment variable,我用起来觉得更好用。 等待安装完之后,就安装了Anaconda了。 下载Cudnn和CUDA 我这里使用的是tensorflow-gpu=1.13.2,因此会用到cuda10.0,与cuda10.0对应的cudnn是7.4.1.5,这个组合我实验过了,绝对是可以用的。 cuda10.0官网的地址是: cuda10.0官网地址 cudnn官网的地址是:需要大家进去后寻找7.4.1.5。 cudnn官网地址 官网下载是比较慢的,可以在百度云上下载,我给大家分享一手。 链接: https://pan

Win10配置TITAN RTX应用于TensorFlow-gpu步骤

…衆ロ難τιáo~ 提交于 2020-03-06 16:29:36
实验室购置了一个TITAN RTX GPU,需安装在服务器上,记录下配置过程备忘用。 系统及硬件确认 由于需要安装在服务器上,首先要将操作系统改为GPU支持的版本。一般服务器安装版本为 Windows server系列,TITAN RTX 并不支持。在官网下载驱动程序必须版本对应,否则会出现兼容性问题。 将GPU按说明书安装至机箱后,通过设备管理器中显示配适器查看系统是否认新安装显卡,显示名称正确即可。本人安装时出现过server版本不认TITAN RTX 的问题。如需更换GPU或转至其他机器,需关机冷却后再将GPU取出,详见说明书。 推荐使用GPU-Z可以快速查看GPU状态。 安装驱动 NVIDIA驱动程序下载地址 搜索对应显卡型号,操作系统版本下载驱动即可。 选择安装图形驱动程序即可,选项一可能会更新驱动,保持当前驱动版本不变也不一定是坏事,稳定。 安装CUDA CUDA = Computer Unified Device Architecture CUDA下载地址 ,我安装的版本是10.1版本。 选择对应操作系统版本,installer type选择上,local会将整个安装文件全部下载好,2G多,而network只包含一个下载客户端,几十兆,后续下载需联网(需要注意防火墙限制以免安装失败)。无本质差异,为不同网络情况的用户而设计,低带宽推荐local下载。

使用GPU进行深度学习过程中的坑

我怕爱的太早我们不能终老 提交于 2020-03-06 12:50:32
1、DeepFaceLab:NVML Shared Library Not Found 解决办法 出现这个提示的原因是安装后的Nvidia显卡目录C:\Program Files\NVIDIA Corporation\NVSMI不存在,造成的,解决办法如链接所示。 https://www.cnblogs.com/LesBlog/p/11219781.html 2、显卡驱动cuda不匹配 查看显卡支持的CUDA版本 https://blog.csdn.net/wangyjfrecky/article/details/55100963?depth_1-utm_source=distribute.pc_relevant_right.none-task&utm_source=distribute.pc_relevant_right.none-task CUDA与相对应的Cudnn对应关系 http://www.manongjc.com/article/101071.html 3、nvcc和nvidia-smi显示的CUDA版本不同? 链接失效,找到了再填上 4、code: 8, reason: CUDNN_STATUS_EXECUTION_FAILED报错 cuda与cudnn版本之间不匹配 目前cuda版本cuda_10.0.130_411.31_win10 cudnn版本是cudnn

my_pc & Lab_pc

牧云@^-^@ 提交于 2020-03-03 15:10:16
首先明确cudnn就是cuda的一个补丁 0. 查看cuda版本 nvcc -V ubuntu下查看cuda版本和cudnn版本 cat / usr / local / cuda / version . txt cat / usr / local / cuda / include / cudnn . h | grep CUDNN_MAJOR - A 2 验证cudnn是否安装成功 cd /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery sudo make ./deviceQuery 1. win10查看cudnn版本 ( env_torch ) C : \Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10 . 0 \include > ` type cudnn . h | findstr CUDNN_MAJOR` #define CUDNN_MAJOR 7` #define CUDNN_VERSION (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL) cudnn-10.0-windows10-x64-v7.6.5.32 下载地址 https://developer.nvidia.com/rdp/cudnn

Could not load dynamic library 'cudart64_101.dll'

丶灬走出姿态 提交于 2020-02-29 14:04:53
我是用miniconda创建的环境,pip安装的tensorflow-gpu==2.1.0,出现了如题的错误。 换成 conda install tensorflow-gpu 就解决了 应该是环境变量吧。。虽然安装了cudnn到cuda/bin目录下,但conda里读不到,conda install的时候下载了cudnn 来源: CSDN 作者: Anmous 链接: https://blog.csdn.net/u010094719/article/details/104571946

ubuntu18.04 | NVIDIA driver + CUDA-10.2 + cuDNN-7.6.5 + Pytorch + TensorFlow-gpu-2.1.0 + OpenCV-4.2.

我怕爱的太早我们不能终老 提交于 2020-02-28 17:45:06
一. NVIDIA显卡驱动 参考: https://www.cnblogs.com/abelsu/p/10625616.html 1. 安装前准备 (1). 检查是否有卡 一般购入电脑时就能有所了解,并且带有该显卡的电脑,都会有NVIDIA的绿色标识贴在机身上,只需要进一步确认就可以: $ lspci | grep -i nvidia 如果输出有带NVIDIA字符就可以了。 (2). 关闭Security Boot 重启电脑,在开机过程中连续敲击某个键进入BOIS设置,我的是F2,有的电脑是F6,F12等,不确定的可以根据电脑情况查一下。 选择Security Boot一栏,回车将Enable改为Disable。 2. 安装NVIDIA显卡驱动 (1). 禁用nouveau 可以先检查一下是否禁用,我的在安装系统时就一并禁用了: $ lsmod | grep nouveau 没有输出则证明被禁用了。 如果有输出,则执行: $ sudo gedit /etc/modprobe.d/blacklist.conf 在文末添加:blacklist nouveau,保存关闭后执行: $ sudo update-initramfs -u 重启电脑再执行: $ lsmod | grep nouveau (2). 把显卡驱动加入PPA: 卸载系统里的低版本驱动: $ sudo apt-get

ubuntu---CUDA 安装注意点总结

风格不统一 提交于 2020-02-28 14:26:42
安装CUDA前的基础准备:1、查看内核、gcc版本并记住。 最好 禁止内核更新,以防止以后工作中意外的系统更新使内核自动更新了,与驱动版本不兼容了。 2、禁用 nouveau驱动。  3、多下载几个版本的 Nvidia-x.x.run 以防止安装不成功时,快速卸载重装。有时候并不是一把成功,安装不报错,但是驱动不工作,nvidia-smi查询无反应,就是驱动没安好 或者 安装的版本与系统硬件有冲突。 4、多下载几个版本的 CUDA-x.x.run。 以防止安装不成功时,快速卸载重装,有时候并不是一把成功。 5、sudo sh cuda_x.x.x_linux.run --no-opengl-libs (双显卡的注意),遇到提示是否安装openGL ,选择no。    如果电脑是双显,且主显是非NVIDIA的GPU在工作需要选择no,否则可以yes,其他都选择yes或者默认即可。    如果电脑是双显卡,且在这一步选择了yes,那么你极有可能安装完CUDA之后,重启图形化界面后遇到登录界面循环问题:输入密码后又跳回密码输入界面。    这是因为电脑是双显,而且用来显示的那块GPU不是NVIDIA,则OpenGL Libraries就不应该安装,否则你正在使用的那块GPU(非NVIDIA的GPU)的OpenGL Libraries会被覆盖,然后GUI就无法工作了。 6

2020-02-25

僤鯓⒐⒋嵵緔 提交于 2020-02-26 07:26:57
tensorflow-gpu安装(跳坑无数次) 1.安装的时候一定要选择好cuda和cudnn支持的tensorflow-gpu版本,本人安装的版本是: win10+anaconda3+python3.7+cuda10.0+cudnn7.6+tensorflow-gpu2.0.0 2.我原先下载的是cuda10.2+cudnn7.6.5+tensorflow-gpu2.1.0,完成以后,win+R打开运行,输入cmd,打开命令窗口,输入pyhon,进行tensorflow-gpu是否安装成功进行测试,输入import tensorflow as tf 出现报错,没有名为tensorflow_core.python,根据提示打开所指的文件夹,看到没有python文件,则说明cuda和cudnn与tensorflow-gpu版本有问题,就是报这个错误,这些都是最新版本,最新版本中会缺失文件夹,所以个人建议不要安装最新版本,降低版本进行安装。 3.然后我安装cuda10.0+cudnn7.6.0+tensorflow-gpu1.14.0,再次进行测试,如果再次报错找不到指定的模块,且报错没有名为nvcuda.dll,则是tensoeflow-gpu版本有问题,尝试降低一下tensorflow-gpu版本,或者升级一下,我安装的版本是tensorflow-gpu1.14.0

Tensorflow2.0 之Could not create cudnn handle: CUDNN_STATUS_ALLOC_FAILED问题

喜你入骨 提交于 2020-02-18 07:20:40
Tensorflow2.0 之Could not create cudnn handle: CUDNN_STATUS_ALLOC_FAILED问题 问题描述: 在tensorflow2.0的学习过程中,遇到了Could not create cudnn handle: CUDNN_STATUS_ALLOC_FAILED,发现这个问题是我在调用kseras模块的卷积类前向传播时触发的,之前的全连接层都没有出现过类似的问题。分析问题应该是gpu没有正确的分配所导致的。 import tensorflow as tf from tensorflow . keras import layers x = tf . random . normal ( [ 2 , 5 , 5 , 3 ] ) w = tf . random . normal ( [ 3 , 3 , 3 , 4 ] ) layer = layers . Conv2D ( 4 , kernel_size = ( 3 , 4 ) , strides = ( 2 , 1 ) , padding = 'SAME' ) out = layer ( x ) print ( out . shape ) 解决方法 解决方法也很简单,只需要在导入模块后加上两行代码即可: devices = tf . config . experimental .