linux服务器cuda,cudnn的安装与卸载

您所在的位置:网站首页 linux卸载cuda100 linux服务器cuda,cudnn的安装与卸载

linux服务器cuda,cudnn的安装与卸载

2023-09-07 19:10| 来源: 网络整理| 查看: 265

写在前面,抛开nvidia驱动和tf-gpu版本谈cuda及cudnn的安装都是耍流氓。大家一定要注意版本对应关系,我遇到了几个典型的因版本不对应导致的问题,我会写在本文后面。

机器显卡为tesla t4.安装的驱动为418.81.07;安装的cuda版本为cuda10.0 ;cudnn版本为7.6.5;tf-gpu版本为1.14.0

1.卸载旧版本: cuda的默认安装在 /usr/local/下,用下面的命令卸载:

sudo /usr/local/cuda-x.x/bin/uninstall_cuda-x.x.pl sudo rm -rf /usr/local/cuda-x.x

2.安装新版本: 下载自己对应的cuda,链接:https://developer.nvidia.com/cuda-toolkit-archive 下载.run文件后上传到/usr/local/ 文件下,这里为了方便直接下载到了/usr/local

第一部分,安装命令:

cd /usr/local/ sudo chmod a+x cuda_10.0.130_410.48_linux.run sudo ./cuda_10.0.130_410.48_linux.run --no-opengl-libs

接下来就输入accept,然后除了提示安装opengl链接库的时候和拷贝samples输入n外,其余输入y。安装完成,重启机器。 第二部分,环境变量(注意换成自己的路径):

export PATH="/usr/local/cuda-10.0/bin:$PATH" export LD_LIBRARY_PATH="/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH"

或者使用命令打开.bashrc,即 sudo gedit ~/.bashrc 在最后面添加(注意换成自己的路径):

export CUDA_HOME=/usr/local/cuda-10.0 export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH export PATH=/usr/local/cuda-10.0/bin:$PATH

完后,利用nvcc -V查看,输出正常即可。

3.我遇到的问题(按顺序来):

首先,我全部装完后(注意这时我的驱动版本不是418.181.07,而是410.129).运行代码后发现第一个问题:

failed call to cuInit: CUDA_ERROR_UNKNOWN

我查阅博客发现有可能是cuda没正确安装,测试我的cuda是否正确安装,通过下列指令:

cd /usr/local/cuda-10.0/samples/1_Utilities/deviceQuery sudo make ./deviceQuery

报错 cudaGetDeviceCount returned 30 -> unknown error Result = FAIL

注意这里,我以为是我的cuda没有正确安装,但是通过nvcc -V是可以查出来版本的,证明cuda没有装错,有可能是驱动不对劲。我挣扎了好久终于决定,装一个新的驱动,即将410.129变为418.181.07.装完后,发现上述两个问题都解决了。所以我的问题根本就是:驱动版本与cuda不匹配。但是但是但是,我在搜素驱动的时候,cuda版本一栏我勾选的是10.0,然后推荐的就是410.129这个,为什么会不行呢,很奇怪(这也告诉我们,推荐的不一定好用)。第二把,在勾选的时候我选择了cuda10.1,推荐的驱动版本为418.181.07.因为是向下兼容的,然后就可以用了。

4.cudnn的安装:

下载链接:https://developer.nvidia.com/rdp/cudnn-archive 相对简单,去官网下载对应版本的cudnn(需注册账号),比如我下载后是:cudnn-10.0-linux-x64-v7.6.5.32.solitairetheme8,放在了 ' / ' 路径下

cp cudnn-10.0-linux-x64-v7.6.5.32.solitairetheme8 cudnn-10.0-linux-x64-v7.6.5.32.tgz # 换后缀 tar -xvf cudnn-10.0-linux-x64-v7.6.5.32.tgz # 解压

解压后,会产生cuda文件夹:

sudo cp cuda/include/cudnn.h /usr/local/cuda-xx.x/include # 按需更改cuda路径 sudo cp cuda/lib64/libcudnn* /usr/local/cuda-xx.x/lib64 # 按需更改cuda路径 sudo chmod a+r /usr/local/cuda-xx.xx/include/cudnn.h /usr/local/cuda-xx.xx/lib64/libcudnn*

到这里nvidia驱动,cuda以及cudnn全部安装完毕。本文注重记录问题,有些步骤不是很详细,这里有几篇博客,可以说是保姆级教程,建议初学者使用:

cuda安装:https://blog.csdn.net/qq_29720657/article/details/109076087                   https://blog.csdn.net/zbr794866300/article/details/106574704

驱动安装:https://blog.csdn.net/qq_30163461/article/details/80314630



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3