win10深度学习环境配置
老硬盘坏道严重,干脆换了块新的机械硬盘,不过环境就需要重新配置了。顺带记录一下...虽然感觉也没什么好记录的...
win10系统,使用anaconda进行配置。python版本3.7,nv驱动版本466.27,cuda版本10.2【适配比较好】,cudnn8.04,pytorch,tf1/tf2
显卡cuda相关
一般来说最坑的就是这里,nv有各种驱动问题,不是老司机又不跟教程很容易跳坑浪费时间。
1.确定nv驱动,cuda,cudnn的版本
首先需要确定深度学习框架支持的版本和显卡本身支持版本,避免装完驱动和cuda发现不兼容。
【框架支持】进pytorch官网:PyTorch,可以看到目前支持的版本——cuda10.2和cuda11.1。那么最好就使用同版本号的cuda。一般来说老版本的比较稳定,我选择10.2。
【cuda版本】桌面打开英伟达控制面板——帮助——系统信息——组件——3d设置——nvcuda.dll——产品名称一栏:显示的是驱动最高支持的cuda版本号。如果支持的版本过低只能通过更新驱动解决。
【更新驱动】nv目前向下兼容问题已经改善了,所以可以直接更新到最新的驱动。可以通过GeForce experience更新。
【cudnn版本】cuDNN Download | NVIDIA Developer查看和cuda匹配的版本。
最后应该确定好nv驱动版本,cuda版本号,cudnn版本号。确定一切都兼容之后开始安装。
2.安装cuda和cudnn
cuda下载界面下载对应版本:CUDA Toolkit 11.3 Downloads | NVIDIA Developer
cudnn下载界面下载对应版本:cuDNN Download | NVIDIA Developer
无脑安装cuda,建议安装在默认路径(c盘)
解压cudnn,同时打开cuda安装路径,默认是这里:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\
进入cuda的所在位置,进入对应版本的cuda,新建名为cudnn的文件夹,复制下载的cudnn中的bin,include,lib三个文件夹进入cudnn文件夹。【不直接拖动到cuda文件夹是为了方便日后更新替换】
高级系统设置——环境变量——系统变量——path中添加两个路径
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\extras\CUPTI\lib64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\cudnn\bin
3.检查cuda安装情况
打开cmd终端
nvcc -V
//应该输入版本信息等
cd C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\extras\demo_suite
.\bandwidthTest.exe
//应该看到测试成功,reslut= PASS说明cuda安装没问题了
Anaconda配置深度学习环境
4.安装anaconda
直接下载最新版,python版本号不重要:Anaconda | The World's Most Popular Data Science Platform
无脑安装anaconda
搜索栏输入anaconda,能够出现anaconda navigator,jupyter,prompt等说明安装没问题。anaconda navigator还算是比较好用的,不熟悉命令可以直接使用这个管理界面。
5.配置深度学习环境
为了避免各种奇怪的bug,最好新建几个新的环境。在navigator中直接新建即可,可以选择对应的python版本号。由于经常有一些奇怪的兼容问题,最好使用相对低版本的python作为初始环境,比如python3.7。
打开pytorch官网填写信息,PyTorch
打开对应环境的terminal,输入官网给出的指令,比如:
conda install pytorch torchvision torchaudio cudatoolkit=10.2 -c pytorch
同样切换环境安装tensorflow或其他架构。
6.测试
对应环境打开python,输入如下代码进行测试
import torch
torch.version.cuda #10.2
torch.cuda.is_available() #True
torch.cuda.device_count() #2有几块显卡就显示几个
tensorflow
import tensorflow as tf
tf.test.gpu_device_name() #名称
tf.test.is_gpu_available() #GPU是否可用,True
测试成功环境就没问题了。如果cuda可用,torch和tensorflow的GPU不可用,说明cudnn安装不对【版本不对,没添加路径】或者框架版本不兼容。
7.激活虚拟环境
我一般不使用根环境,所以需要激活一下对应的环境。
activate pytorch //对应的环境名称[可以在navigator或者conda命令查看]
//应该看到成功标志
activate py-tf2
activate py-tf1
8.jupyter notebook修改默认路径
主要是修改一下路径,jupyter默认路径一般是c盘或者用户根目录,所以需要手动迁移到工作路径。方法也很简单:
打开anaconda prompt,输入以下代码,并复制输出的default config路径
jupyter notebook --generate-config
y
打开jupyter_notebook_config.py,将c.NotebookApp.notebook_dir
取消注释,填写自己的工作路径并保存。
右键jupyternotebook,选择属性,删除目标中的“%USERPROFILE%”
。
大功告成,现在打开jupyter应该是工作路径了。