Драйвер NVIDIA не может найти libnvidia-ml.so и не может успешно установить cuda
У меня на компьютере установлена следующая видеокарта nvidia (ubuntu18.04LTS)
Intel i5 9600K
NVIDIA GeForce RTX2070
Я установил драйверы cuda и nvidia следующим образом
sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo apt update
sudo apt install cuda cuda-drivers
sudo reboot
затем
nvidia-smi
NVIDIA-SMI couldn't find libnvidia-ml.so library in your system. Please make sure that the NVIDIA Display Driver is properly installed and present in your system.
Please also try adding directory that contains libnvidia-ml.so to your system PATH.
И я ищу libnvidia-ml.so
ls /usr/lib/nvidia
pre-install
Любое предложение, чтобы заставить это работать? Где nvidia-smi пытается найти libnvidia-ml.so?
1 ответ
Я решил эту проблему. удалить все cuda и nvidia-драйверы
sudo apt-get --purge remove nvidia-*
sudo apt-get --purge remove cuda-*
а потом
автоматическая установка драйверов
sudo ubuntu-drivers autoinstall
sudo reboot
проверить, успешно ли установлены драйверы
nvidia-smi
затем установите cuda-10.0(я буду использовать tensflow=1.13.1)
sudo apt install nvidia-driver-418
sudo apt-get install cuda-10.0
установить Cudnn
echo "deb https://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64 /" | sudo tee /etc/apt/sources.list.d/nvidia-ml.list
sudo apt update
sudo apt install libcudnn7-dev=7.5.0.56-1+cuda10.0
установка пути
sudo cp -a cuda/lib64/* /usr/lib/cuda/lib64/
sudo cp -a cuda/include/* /usr/lib/cuda/include/