ps: 这是以前总结的一篇旧文,但依然可以作为参考,安装最新版本的环境,故不做修改,直接搬到这里。
最近在用暗影精灵跑深度学习 (基于 tensorflow),随着数据量增多,CPU 已经明显太慢,效率太低,所以把系统环境重新安装了一遍,搭建 GPU 环境。
机器平台: I7+1050TI+UBUNTU16.04
1. 安装驱动:
参考之前的一篇博文: 暗影精灵 2 代:ubuntu16.04 安装 NVIDIA GTX1050TI 显卡驱动
这个可能会很慢,受不了的话可以到官网下载对应驱动来装 (切勿使用 CUDA 默认的驱动,会导致无限登录问题)
官网链接:https://www.nvidia.com/Download/index.aspx?lang=en-us
由于最新版 CUDA10.1 要求驱动高于 418.39,参见:
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
安装 4.30 无法启动界面,换成 418.56,驱动正常,亦符合 CUDA 版本要求
2. CUDA
官网最新版:https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=runfilelocal
按提示安装即可,注意去掉驱动安装项;
安装完成后,记得添加环境变量:
export PATH=/usr/local/cuda-10.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64:$LD_LIBRARY_PATH
我安装的是最新 10.1 版本
测试:
进入~/NVIDIA_CUDA-10.1_Samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
3. 安装 cudnn
官网:https://developer.nvidia.com/rdp/cudnn-download
解压得到 cuda 目录,将其内容拷贝到对应的 /usr/local/cuda-10.1 文件夹下即可
4.anconda
参考之前的一篇博文:Ubuntu16.04 安装 anaconda3 支持 python3
清华的源阵亡了,我直接官网下的;
我装的 python3.7 版,同样记得添加环境变量;
5. 安装 tensorflow-gpu
conda create -n tf_gpu
conda install tensorflow-gpu