После установки правильного драйвера NVIDIA nvidia-smi все равно не может его найти. (Ubuntu 18.4)
Я пытаюсь настроить свою систему для CUDA, установив последние драйверы NVIDIA. Я уже установил драйверы, но все равно получаю ошибку при запуске nvidia-smi
~ nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
После получения этого сообщения я следовал нескольким различным учебным пособиям, а именно этому: Проблемы с графическим драйвером Nvidia и CUDA после обновления apt-get\
Но когда я пытаюсь очистить старые драйверы, я получаю сообщение об ошибке:
~ sudo apt-get purge nvidia*
zsh: no matches found: nvidia* (**EDIT**: THIS HAS BEEN FIXED, I CAN NOW PURGE, but that didn't help)
Тем не менее, я не могу просто установить самые последние драйверы, потому что они уже установлены.
~ sudo apt-get install nvidia-driver-396
Reading package lists... Done
Building dependency tree
Reading state information... Done
nvidia-driver-396 is already the newest version (396.54-0ubuntu0~gpu18.04.1).
The following packages were automatically installed and are no longer required:
libnvidia-common-390 libwayland-client0:i386 libwayland-server0:i386
Use 'sudo apt autoremove' to remove them.
0 upgraded, 0 newly installed, 0 to remove and 0 not upgraded.
Я думаю, что моя лучшая ставка на данный момент - это удалить и переустановить драйвер, но я не уверен, как это сделать. И я не знаю, почему драйвер не используется.
Дополнительные примечания:
lsmod | grep nvidia
dmesg | grep NVRM
и ничего не вернуть.
Почему драйвер до сих пор не зарегистрирован? Любая помощь приветствуется.
Редактировать Я смог очистить существующий NVIDIA и попробовать еще раз, но он все еще не работает.
Возможно, проблема в том, что nouveau не отключен должным образом.
Когда я проверяю, какой драйвер используется:
➜ Documents sudo lshw -class video | grep driver=
configuration: driver=nouveau latency=0
configuration: driver=i915 latency=0
Так что это все еще там. Я использовал этот сайт https://linuxconfig.org/how-to-disable-nouveau-nvidia-driver-on-ubuntu-18-04-bionic-beaver-linux чтобы помочь мне отключить его. Выполнение следующей команды дает ожидаемый результат:
➜ Documents cat /etc/modprobe.d/blacklist-nvidia-nouveau.conf
blacklist nouveau
options nouveau modeset=0
И это все еще не работает. Мысли?
1 ответ
Если вы удалили драйверы NVIDIA, а затем переустановить их вам нужно prime-select
туда и обратно в Intel, затем обратно в NVIDIA:
prime-select intel
prime-select nvidia
После этого nvidia-smi
должен преуспеть.
Хм, это может быть трудно, где, если я правильно понял, nvidia официально поддерживает только 16.04 и 17.10 для CUDA. Так что для работы с 18.04 могут потребоваться некоторые усилия, проверили ли вы форумы nvidia на предмет каких-либо рекомендаций.