Не могу загрузиться в мою систему после попытки установить Cuda 10.0

У меня есть компьютер с приличным графическим процессором, и я пытался заставить работать графический процессор Tensorflow. Начну с того, что я давно пользуюсь Arch Linux и новичок в Ubuntu, но в данном случае я хотел бы попробовать.

Я создал virtualenv, в который установил tensorflow-gpu и все необходимое. Мой код работал, но он не использовал графический процессор, поэтому после некоторой проверки я подумал, что проблема может быть в CUDA. Основываясь на документации Tensorflow, Tensorflow 2.0 (тот, который установлен с помощью pip) нуждается в Cuda 10.0, поэтому я пошел его установить.

Я следовал этому руководству: https://towardsdatascience.com/how-to-install-tensorflow-gpu-on-ubuntu-18-04-1c1d2d6d6fd2

В частности, я сделал шаг 2, потому что драйверы Nvidia уже работали. Я зашел на веб-сайт Nvidia, загрузил Cuda 10.0 и выполнил 4 инструкции из этого руководства, которые были такими же на веб-сайте Nvidia.

wget https://developer.nvidia.com/compute/cuda/10.0/Prod/local_installers/cuda-repo-ubuntu1804-10-0-local-10.0.130-410.48_1.0-1_amd64
sudo dpkg -i cuda-repo-ubuntu1804-10-0-local-10.0.130-410.48_1.0-1_amd64
sudo apt-key add /var/cuda-repo-10-0-local-10.0.130-410.48/7fa2af80.pub
sudo apt-get update

Как только я это сделал, я понял, что каким-то образом он решил понизить версию моих драйверов nvidia до 410.48 и что компьютеру требуется перезагрузка.

Я набрал "nvidia-smi", и он дал мне "Не удалось инициализировать NVML: несовпадение версии драйвера / библиотеки".

Это когда я запаниковал, я искал это в Google, и кто-то решил нечто подобное, удалив cuda, поэтому подумал, что если я удалю Cuda, он вернется к исходной конфигурации, и я сделал:

"sudo apt-get remove cuda"

Тогда я снова сделал "nvidia-smi" и получил ту же ошибку, что и раньше. И это когда я решил перезагрузить компьютер с помощью "sudo reboot", и компьютер снова не загружается.

0 ответов

Другие вопросы по тегам