【已解决】Failed to initialize NVML: Driver/library version mismatch NVML library version: 535.161

您所在的位置:网站首页 amd驱动版本不匹配怎么办 【已解决】Failed to initialize NVML: Driver/library version mismatch NVML library version: 535.161

【已解决】Failed to initialize NVML: Driver/library version mismatch NVML library version: 535.161

2024-06-10 23:19| 来源: 网络整理| 查看: 265

问题描述

        今天遇到这样一个问题:Failed to initialize NVML: Driver/library version mismatch NVML library version: 535.161

原因分析和解决

        其实这种问题一般都是系统检测到驱动和cuda版本不一致的原因导致的,这也就是在我们用update操作时会有这样的问题:

sudo apt-get update -- 从服务器获取软件列表,并在本地保存为文件。 sudo apt-get upgrade -- 本地安装软件与本地软件列表对比,如本地安装版本低,会提示更新。

        在 linux中,安装软件最常用到的是 sudo apt-get ,这个命令会从软件仓库中检索并拉取我们想要的软件。 我就是使用的第一条命令。

        查看我的升级日志,发现最近确实有升级的记录,那就很明显了。

(base) visionx@visionx:~$ cat /var/log/dpkg.log |grep nvidia|grep libnvidia-common 2024-04-09 06:50:34 upgrade libnvidia-common-525:all 525.147.05-0ubuntu0.20.04.1 525.147.05-0ubuntu2.20.04.1 2024-04-09 06:50:34 status half-configured libnvidia-common-525:all 525.147.05-0ubuntu0.20.04.1 2024-04-09 06:50:34 status unpacked libnvidia-common-525:all 525.147.05-0ubuntu0.20.04.1 2024-04-09 06:50:34 status half-installed libnvidia-common-525:all 525.147.05-0ubuntu0.20.04.1 2024-04-09 06:50:35 status unpacked libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1 2024-04-09 06:50:35 install libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1 2024-04-09 06:50:35 status half-installed libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1 2024-04-09 06:50:35 status unpacked libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1 2024-04-09 06:50:35 upgrade libnvidia-common-520:all 525.147.05-0ubuntu0.20.04.1 525.147.05-0ubuntu2.20.04.1 2024-04-09 06:50:35 status half-configured libnvidia-common-520:all 525.147.05-0ubuntu0.20.04.1 2024-04-09 06:50:35 status unpacked libnvidia-common-520:all 525.147.05-0ubuntu0.20.04.1 2024-04-09 06:50:35 status half-installed libnvidia-common-520:all 525.147.05-0ubuntu0.20.04.1 2024-04-09 06:50:36 status unpacked libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1 2024-04-09 06:50:36 configure libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1 2024-04-09 06:50:36 status unpacked libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1 2024-04-09 06:50:36 status half-configured libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1 2024-04-09 06:50:36 status installed libnvidia-common-535:all 535.161.07-0ubuntu0.20.04.1 2024-04-09 06:50:36 configure libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1 2024-04-09 06:50:36 status unpacked libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1 2024-04-09 06:50:36 status half-configured libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1 2024-04-09 06:50:36 status installed libnvidia-common-520:all 525.147.05-0ubuntu2.20.04.1 2024-04-09 06:50:36 configure libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1 2024-04-09 06:50:36 status unpacked libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1 2024-04-09 06:50:36 status half-configured libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1 2024-04-09 06:50:36 status installed libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1 2024-04-09 06:57:54 status installed libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1 2024-04-09 06:57:54 remove libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1 2024-04-09 06:57:54 status half-configured libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1 2024-04-09 06:57:54 status half-installed libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1 2024-04-09 06:57:54 status config-files libnvidia-common-525:all 525.147.05-0ubuntu2.20.04.1 2024-04-09 06:57:55 status not-installed libnvidia-common-525:all

        当我把这个问题喂给chatgpt的时候,她给了我这样的答复:

这个错误通常是因为 NVIDIA 驱动与 NVML 库版本不匹配所致。解决此问题的一种方法是更新或回滚 NVIDIA 驱动程序,以使其与当前安装的 NVML 库版本匹配。

首先,您可以尝试更新 NVIDIA 驱动程序到与 NVML 库版本匹配的最新版本。您可以从 NVIDIA 官方网站下载最新的驱动程序,并确保它与您当前的 NVML 库版本兼容。

如果更新驱动程序不起作用,您还可以尝试降级 NVML 库版本,使其与当前安装的 NVIDIA 驱动程序兼容。您可以从 NVIDIA Developer 网站下载适用于您的系统的 NVML 库的旧版本,并将其安装到您的系统中。

如果以上方法都不起作用,您可能需要进一步检查系统中的其他配置或依赖项,以确保 NVIDIA 驱动程序与 NVML 库版本匹配,并且系统设置正确。您还可以考虑重新安装 NVIDIA 驱动程序和 NVML 库,以解决潜在的安装问题。

        而我在互联网冲浪时也得到了类似的答复 

        并且给出的解决办法是这样的:

        解决办法一、更新驱动

1.卸载驱动

sudo apt-get purge nvidia*

2.查找可用的驱动版本

ubuntu-drivers devices

        查找本机内核版本:

cat /proc/driver/nvidia/version

        发现为440.33.01

        于是尝试安装440版本的驱动:

sudo apt-get install nvidia-driver-440 nvidia-settings nvidia-prime

        然而安装失败,某些包不匹配,系统解决不了错误,卡了一会时间。

        最终尝试安装415版本的,安装成功了

sudo apt-get install nvidia-driver-415 nvidia-settings nvidia-prime

        当然还有人这么建议,相当哇塞!!! 

        解决办法二、重启

        这个方法在我的实战经历中我发现,凡是cuda和driver不一样的情况下大多数都可以

        解决办法三、其他方法 

        这种方法还是挺好想的,但是我确实没想到哦,让我们感谢质数哥!

我尝试了几种思路: 1.最简单的是重启,貌似能解决; 2.重启不能解决就换重新安装了,后来就把一个固定的driver安装文件保存在本地,出了问题就重新sudo安装,好像也行,就是折腾; 3.固定版本,这个我试过,好像不咋好用; 4.设置驱动不更新,这个到目前为止还没出现问题。 上面4个方法是我都一一尝试过的,我用的系统是ubuntu的,具体方法也都是在知乎和csdn找的。

作者链接:质数 - 知乎

        当然除了质数哥给的方法,还有其他的  

        终极方法:关闭自动更新 

相关链接

        nvidia-smi指令报错:Failed to initialize NVML: Driver解决 - 知乎分配的新电脑,ubuntu18.04系统,nvidia的驱动都装好了,但是使用指令: nvidia-smi报错: Failed to initialize NVML: Driver/library version mismatch安装gpustat也显示找不到gpu,且cuda,深度学习gpu均不行 …icon-default.png?t=N7T8https://zhuanlan.zhihu.com/p/94378201解决nvidia-smi “Failed to initialize NVML: Driver/library version mismatch”_nvml library version: 535.154-CSDN博客文章浏览阅读1.4k次,点赞3次,收藏10次。根据网上类似问题的线索,大概率是自动升级后library立即更新,而driver由于是kernal module不会自动运行新版本导致两者不匹配。今天发现有如下错误。什么也不需要做,reboot 后 driver version 就更新了。在下文可以看到reboot后driver已更新到。原来的设定如下,我把。这个问题还是挺常见的,在此主要记录一下我遇到的具体情况。不是工作时段,很可能是自动完成的。已经安装了,只是运行的还是旧版本。都改了,不知道是否管用。,和NVML保持一致了。这里不是很确定是否正确。_nvml library version: 535.154https://blog.csdn.net/jingjm00/article/details/135865160

完结撒花

        我为什么要教阿三哥使用筷子呢?



【本文地址】


今日新闻


推荐新闻


    CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3