После установки правильного драйвера NVIDIA nvidia-smi все равно не может его найти. (Ubuntu 18.4)

Я пытаюсь настроить свою систему для CUDA, установив последние драйверы NVIDIA. Я уже установил драйверы, но все равно получаю ошибку при запуске nvidia-smi

~ nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

После получения этого сообщения я следовал нескольким различным учебным пособиям, а именно этому: Проблемы с графическим драйвером Nvidia и CUDA после обновления apt-get\

Но когда я пытаюсь очистить старые драйверы, я получаю сообщение об ошибке:

~ sudo apt-get purge nvidia*                  
zsh: no matches found: nvidia* (**EDIT**: THIS HAS BEEN FIXED, I CAN NOW PURGE, but that didn't help)

Тем не менее, я не могу просто установить самые последние драйверы, потому что они уже установлены.

~ sudo apt-get install nvidia-driver-396
Reading package lists... Done
Building dependency tree       
Reading state information... Done
nvidia-driver-396 is already the newest version (396.54-0ubuntu0~gpu18.04.1).
The following packages were automatically installed and are no longer required:
  libnvidia-common-390 libwayland-client0:i386 libwayland-server0:i386
Use 'sudo apt autoremove' to remove them.
0 upgraded, 0 newly installed, 0 to remove and 0 not upgraded.

Я думаю, что моя лучшая ставка на данный момент - это удалить и переустановить драйвер, но я не уверен, как это сделать. И я не знаю, почему драйвер не используется.

Дополнительные примечания:

 lsmod | grep nvidia
 dmesg | grep NVRM

и ничего не вернуть.

Почему драйвер до сих пор не зарегистрирован? Любая помощь приветствуется.

Редактировать Я смог очистить существующий NVIDIA и попробовать еще раз, но он все еще не работает.

Возможно, проблема в том, что nouveau не отключен должным образом.

Когда я проверяю, какой драйвер используется:

➜  Documents sudo lshw -class video | grep driver=
       configuration: driver=nouveau latency=0
       configuration: driver=i915 latency=0

Так что это все еще там. Я использовал этот сайт https://linuxconfig.org/how-to-disable-nouveau-nvidia-driver-on-ubuntu-18-04-bionic-beaver-linux чтобы помочь мне отключить его. Выполнение следующей команды дает ожидаемый результат:

➜  Documents cat /etc/modprobe.d/blacklist-nvidia-nouveau.conf
blacklist nouveau
options nouveau modeset=0

И это все еще не работает. Мысли?

1 ответ

Если вы удалили драйверы NVIDIA, а затем переустановить их вам нужно prime-select туда и обратно в Intel, затем обратно в NVIDIA:

prime-select intel

prime-select nvidia

После этого nvidia-smi должен преуспеть.

Хм, это может быть трудно, где, если я правильно понял, nvidia официально поддерживает только 16.04 и 17.10 для CUDA. Так что для работы с 18.04 могут потребоваться некоторые усилия, проверили ли вы форумы nvidia на предмет каких-либо рекомендаций.

Другие вопросы по тегам