NVMLの初期化に失敗しました:ドライバー/ライブラリバージョンの不一致の問題分析



Failed Initialize Nvml



このエラーは、nvidia-smiが実行されたときに報告されます。解決策は非常に簡単ですが、コンピューターを再起動するだけですが、エラーの理由で、分析と拡張を行い、常に予期しない利益を期待してください、ハハ。

[root@xxxxx]$cat /proc/driver/nvidia/version NVRM version: NVIDIA UNIX x86_64 Kernel Module 396.44 Wed Jul 11 16:51:49 PDT 2018 GCC version: gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.10)

NVRMのバージョンが396.44であることを示してから、グラフィックカードドライバのバージョンを確認してください。

[root@xxxxx]$sudo dpkg --list | grep nvidia rc nvidia-384 384.130-0ubuntu0.16.04.1 amd64 NVIDIA binary driver - version 384.130 ii nvidia-396 396.82-0ubuntu1 amd64 NVIDIA binary driver - version 396.82 ii nvidia-cuda-dev 7.5.18-0ubuntu1 amd64 NVIDIA CUDA development files ii nvidia-cuda-doc 7.5.18-0ubuntu1 all NVIDIA CUDA and OpenCL documentation ii nvidia-cuda-gdb 7.5.18-0ubuntu1 amd64 NVIDIA CUDA Debugger (GDB) ii nvidia-cuda-toolkit 7.5.18-0ubuntu1 amd64 NVIDIA CUDA development toolkit ii nvidia-opencl-dev:amd64 7.5.18-0ubuntu1 amd64 NVIDIA OpenCL development files rc nvidia-opencl-icd-384 384.130-0ubuntu0.16.04.1 amd64 NVIDIA OpenCL ICD ii nvidia-opencl-icd-396 396.82-0ubuntu1 amd64 NVIDIA OpenCL ICD ii nvidia-prime 0.8.2 amd64 Tools to enable NVIDIA's Prime ii nvidia-profiler 7.5.18-0ubuntu1 amd64 NVIDIA Profiler for CUDA and OpenCL ii nvidia-settings 418.40.04-0ubuntu1 amd64 Tool for configuring the NVIDIA graphics driver ii nvidia-visual-profiler 7.5.18-0ubuntu1 amd64 NVIDIA Visual Profiler for CUDA and OpenCL

注:iiは、「インストールしてインストールする必要がある」ことを意味します。rcは、削除/アンインストールされたことを意味しますが、構成ファイルはまだ存在します。

ここに示されているドライバーのバージョンはnvidia-396.82ですが、違いはここにあるはずです(396.44対396.82)、なぜ今突然一貫性がなくなったのでしょうか?カーネルにすでにロードされているバージョンが遅れているため、dpkgログを確認してください。

[root@xxxxx]$cat /var/log/dpkg.log| grep nvidia 2019-04-29 14:08:57 upgrade nvidia-396:amd64 396.44-0ubuntu1 396.82-0ubuntu1 2019-04-29 14:08:57 status half-configured nvidia-396:amd64 396.44-0ubuntu1 2019-04-29 14:09:04 status unpacked nvidia-396:amd64 396.44-0ubuntu1 2019-04-29 14:09:04 status half-installed nvidia-396:amd64 396.44-0ubuntu1 2019-04-29 14:09:13 status half-installed nvidia-396:amd64 396.44-0ubuntu1 2019-04-29 14:09:13 status unpacked nvidia-396:amd64 396.82-0ubuntu1 2019-04-29 14:09:13 status unpacked nvidia-396:amd64 396.82-0ubuntu1 2019-04-29 14:09:14 upgrade nvidia-opencl-icd-396:amd64 396.44-0ubuntu1 396.82-0ubuntu1 2019-04-29 14:09:14 status half-configured nvidia-opencl-icd-396:amd64 396.44-0ubuntu1 2019-04-29 14:09:14 status unpacked nvidia-opencl-icd-396:amd64 396.44-0ubuntu1 2019-04-29 14:09:14 status half-installed nvidia-opencl-icd-396:amd64 396.44-0ubuntu1 2019-04-29 14:09:14 status half-installed nvidia-opencl-icd-396:amd64 396.44-0ubuntu1 2019-04-29 14:09:14 status unpacked nvidia-opencl-icd-396:amd64 396.82-0ubuntu1 2019-04-29 14:09:14 status unpacked nvidia-opencl-icd-396:amd64 396.82-0ubuntu1 2019-04-29 14:09:14 upgrade nvidia-settings:amd64 410.72-0ubuntu1 418.40.04-0ubuntu1 2019-04-29 14:09:14 status half-configured nvidia-settings:amd64 410.72-0ubuntu1 2019-04-29 14:09:14 status unpacked nvidia-settings:amd64 410.72-0ubuntu1 2019-04-29 14:09:14 status half-installed nvidia-settings:amd64 410.72-0ubuntu1 2019-04-29 14:09:14 status half-installed nvidia-settings:amd64 410.72-0ubuntu1 2019-04-29 14:09:14 status unpacked nvidia-settings:amd64 418.40.04-0ubuntu1 2019-04-29 14:09:14 status unpacked nvidia-settings:amd64 418.40.04-0ubuntu1 2019-04-29 14:09:59 configure nvidia-396:amd64 396.82-0ubuntu1 2019-04-29 14:09:59 status unpacked nvidia-396:amd64 396.82-0ubuntu1 2019-04-29 14:09:59 status unpacked nvidia-396:amd64 396.82-0ubuntu1 2019-04-29 14:09:59 status half-configured nvidia-396:amd64 396.82-0ubuntu1 2019-04-29 14:10:54 status installed nvidia-396:amd64 396.82-0ubuntu1 2019-04-29 14:10:55 configure nvidia-opencl-icd-396:amd64 396.82-0ubuntu1 2019-04-29 14:10:55 status unpacked nvidia-opencl-icd-396:amd64 396.82-0ubuntu1 2019-04-29 14:10:55 status unpacked nvidia-opencl-icd-396:amd64 396.82-0ubuntu1 2019-04-29 14:10:55 status half-configured nvidia-opencl-icd-396:amd64 396.82-0ubuntu1 2019-04-29 14:10:55 status installed nvidia-opencl-icd-396:amd64 396.82-0ubuntu1 2019-04-29 14:10:55 configure nvidia-settings:amd64 418.40.04-0ubuntu1 2019-04-29 14:10:55 status unpacked nvidia-settings:amd64 418.40.04-0ubuntu1 2019-04-29 14:10:55 status unpacked nvidia-settings:amd64 418.40.04-0ubuntu1 2019-04-29 14:10:55 status half-configured nvidia-settings:amd64 418.40.04-0ubuntu1 2019-04-29 14:10:55 status installed nvidia-settings:amd64 418.40.04-0ubuntu1

nvidiaグラフィックスドライバーが396.44から396.82にアップグレードされていることを示します(手動でapt-getアップグレードを実行したためと思われますか?)が、カーネルモデルを再ロードする必要があります。実際、カーネルドライバモジュールはすでに配置されており、カーネルにリロードするのを待っているだけです。信じてはいけません。

[root@xxxxx]$find /lib/modules/$(uname -r) -name '*nvidia*.ko' -ls 8677356 64 -rw-r--r-- 1 root root 63846 Feb 13 04:31 /lib/modules/4.15.0-46-generic/kernel/drivers/video/fbdev/nvidia/nvidiafb.ko 8650998 72 -rw-r--r-- 1 root root 69852 Apr 29 14:10 /lib/modules/4.15.0-46-generic/updates/dkms/nvidia_396_drm.ko 8650995 18392 -rw-r--r-- 1 root root 18830596 Apr 29 14:10 /lib/modules/4.15.0-46-generic/updates/dkms/nvidia_396.ko 8650997 1292 -rw-r--r-- 1 root root 1319556 Apr 29 14:10 /lib/modules/4.15.0-46-generic/updates/dkms/nvidia_396_modeset.ko 8650999 1260 -rw-r--r-- 1 root root 1286612 Apr 29 14:10 /lib/modules/4.15.0-46-generic/updates/dkms/nvidia_396_uvm.ko [root@xxxxx]$modinfo /lib/modules/4.15.0-46-generic/updates/dkms/nvidia_396.ko filename: /lib/modules/4.15.0-46-generic/updates/dkms/nvidia_396.ko alias: char-major-195-* version: 396.82 supported: external license: NVIDIA srcversion: 1972864AFC73362967DE403 alias: pci:v000010DEd00000E00sv*sd*bc04sc80i00* alias: pci:v000010DEd*sv*sd*bc03sc02i00* alias: pci:v000010DEd*sv*sd*bc03sc00i00* depends: ipmi_msghandler retpoline: Y name: nvidia vermagic: 4.15.0-46-generic SMP mod_unload parm: NVreg_Mobile:int parm: NVreg_ResmanDebugLevel:int parm: NVreg_RmLogonRC:int parm: NVreg_ModifyDeviceFiles:int parm: NVreg_DeviceFileUID:int parm: NVreg_DeviceFileGID:int parm: NVreg_DeviceFileMode:int parm: NVreg_UpdateMemoryTypes:int parm: NVreg_InitializeSystemMemoryAllocations:int parm: NVreg_UsePageAttributeTable:int parm: NVreg_MapRegistersEarly:int parm: NVreg_RegisterForACPIEvents:int parm: NVreg_CheckPCIConfigSpace:int parm: NVreg_EnablePCIeGen3:int parm: NVreg_EnableMSI:int parm: NVreg_TCEBypassMode:int parm: NVreg_UseThreadedInterrupts:int parm: NVreg_EnableStreamMemOPs:int parm: NVreg_EnableBacklightHandler:int parm: NVreg_RestrictProfilingToAdminUsers:int parm: NVreg_EnableUserNUMAManagement:int parm: NVreg_MemoryPoolSize:int parm: NVreg_IgnoreMMIOCheck:int parm: NVreg_RegistryDwords:charp parm: NVreg_RegistryDwordsPerDevice:charp parm: NVreg_RmMsg:charp parm: NVreg_AssignGpus:charp

398.62グラフィックカードドライバカーネルモジュールを再起動する最も簡単な方法を使用しました。