NVIDIA-GPU-Treiber installieren
Zuletzt aktualisiert am
In dieser Anleitung lernen Sie, wie Sie Treiber für NVIDIA-GPU-Maschinentypen installieren:
Sie können die NVIDIA-Treiber über den Paketmanager auf der Linux-Distribution Ihres Host-Systems installieren. Die aktuellen Distributionen, aus denen Sie wählen können, finden Sie in der NVIDIA-Dokumentation. Für das folgende Beispiel verwenden wir Ubuntu & Fedora sowie den APT-Paketmanager. Für andere Linux-Distributionen konsultieren Sie bitte die offizielle Website für das CUDA-Toolkit.
-
Installieren Sie den öffentlichen GPG-Schlüssel des CUDA-Repositorys. Führen Sie die folgenden Befehle nacheinander aus.
Terminal-Fenster wget [https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-keyring_1.1-1_all.deb](https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-keyring_1.1-1_all.deb)sudo dpkg -i cuda-keyring_1.1-1_all.debsudo apt-get update -
Installieren Sie den Treiber.
Terminal-Fenster sudo apt-get install -y nvidia-open -
Installieren Sie den Fabric-Manager (nur für den Maschinentyp n3.104d.g8). Der Fabric-Manager ist notwendig, um die Verbindung mehrerer GPUs mit NVIDIA NVSwitch zu nutzen.
Terminal-Fenster # Der Treiber und der Fabric-Manager sollten die gleiche Version haben, z. B. Version 560:sudo apt install nvidia-fabricmanager-560# Starten Sie Ihre Maschine neu:sudo rebootStarten Sie den Fabric-Manager:sudo systemctl start nvidia-fabricmanager
Um die VMs, denen eine GPU zugewiesen ist, ordnungsgemäß nutzen zu können, müssen die korrekten Treiber installiert sein. Die erforderlichen Treiber sowie eine Liste der unterstützten Linux-Distributionen finden Sie in der NVIDIA Datacenter-Dokumentation. Sie können diese mithilfe einer .run-Datei installieren.
-
Legen Sie die Variable BASE_URL fest. Sie beschreibt den ersten Teil der Download-URL.
Terminal-Fenster BASE_URL=[https://us.download.nvidia.com/tesla](https://us.download.nvidia.com/tesla) -
Legen Sie die Variable
DRIVER_VERSIONfest, die die aktuellste Treiberversion enthält.Terminal-Fenster DRIVER_VERSION=565.57.01 -
Verwenden Sie den Befehl
curl, um die .run-Datei von NVIDIA herunterzuladen.Terminal-Fenster curl -fSsl -O $BASE_URL/$DRIVER_VERSION/NVIDIA-Linux-x86_64-$DRIVER_VERSION.run -
Installieren Sie die Abhängigkeiten.
Terminal-Fenster sudo apt install build-essential -
Führen Sie die .run-Datei aus, um die Treiber zu installieren.
Terminal-Fenster sudo sh NVIDIA-Linux-x86_64-$DRIVER_VERSION.run
Sie können die NVIDIA-Treiber über den Paketmanager auf der Linux-Distribution Ihres Host-Systems installieren. Die aktuellen Distributionen, aus denen Sie wählen können, finden Sie in der NVIDIA-Dokumentation. Für das folgende Beispiel verwenden wir Ubuntu & Fedora sowie den APT-Paketmanager. Für andere Linux-Distributionen konsultieren Sie bitte die offizielle Website für das CUDA-Toolkit.
-
Installieren Sie die Header und Entwicklungspakete für den aktuell ausgeführten Kernel.
Terminal-Fenster sudo apt-get install linux-headers-$(uname -r) -
Installieren Sie den öffentlichen GPG-Schlüssel des CUDA-Repositorys. Führen Sie die folgenden Befehle nacheinander aus.
Terminal-Fenster wget [https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin](https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin)sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600wget [https://developer.download.nvidia.com/compute/cuda/12.2.2/local_installers/cuda-repo-ubuntu2204-12-2-local_12.2.2-535.104.05-1_amd64.deb](https://developer.download.nvidia.com/compute/cuda/12.2.2/local_installers/cuda-repo-ubuntu2204-12-2-local_12.2.2-535.104.05-1_amd64.deb)sudo dpkg -i cuda-repo-ubuntu2204-12-2-local_12.2.2-535.104.05-1_amd64.debsudo cp /var/cuda-repo-ubuntu2204-12-2-local/cuda-*-keyring.gpg /usr/share/keyrings/ -
Aktualisieren Sie den Cache des APT-Repositorys und installieren Sie den Treiber sowie das CUDA-Toolkit.
Terminal-Fenster sudo apt-get updatesudo apt-get -y install cuda-driverssudo apt-get -y install cuda
So verwenden Sie das NVIDIA System Management Interface (SMI)
Abschnitt betitelt „So verwenden Sie das NVIDIA System Management Interface (SMI)“nvidia-smi (auch NVSMI) bietet Überwachungs- und Verwaltungsfunktionen für alle NVIDIA-Architekturfamilien. Es wird zusammen mit den offenen NVIDIA-Treibern und dem CUDA-Toolkit bereitgestellt. Ein Beispiel für eine NVSMI-Ausgabe:
nvidia-smi+-----------------------------------------------------------------------------------------+| NVIDIA-SMI 565.57.01 Driver Version: 565.57.01 CUDA Version: 12.7 ||-----------------------------------------+------------------------+----------------------+| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC || Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. || | | MIG M. ||=========================================+========================+======================|| 0 NVIDIA A100 80GB PCIe On | 00000000:05:00.0 Off | 0 || N/A 31C P0 45W / 300W | 1MiB / 81920MiB | 0% Default || | | Disabled |+-----------------------------------------+------------------------+----------------------+
+-----------------------------------------------------------------------------------------+| Processes: || GPU GI CI PID Type Process name GPU Memory || ID ID Usage ||=========================================================================================|| Keine laufenden Prozesse gefunden |+-----------------------------------------------------------------------------------------+## So führen Sie Aktionen nach der Installation durch
Bevor Sie das CUDA-Toolkit und den Treiber verwenden können, müssen Sie die folgenden Schritte durchführen. Der erste ist das Hinzufügen des Installationspfads zu Ihrer **PATH**-Variable. Wenn Sie die `.run`-Installationsmethode verwendet haben, führen Sie einfach den folgenden Befehl aus. Im folgenden Beispiel verwenden wir `cuda-12.2`:
```bashexport PATH=/usr/local/cuda-12.2/bin${PATH:+:${PATH}}Für die runfile-Installation müssen Sie auch den oben verwendeten Pfad zu LD_LIBRARY_PATH hinzufügen. Im Folgenden verwenden wir “cuda-12.2” als Beispiel:
# For 64-bit operating systems:export LD_LIBRARY_PATH=/usr/local/cuda-12.2/lib64\ ${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
# For 32-bit operating systems:export LD_LIBRARY_PATH=/usr/local/cuda-12.2/lib\ ${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}Wenn Sie einen der Paketmanager verwendet haben, müssen Sie auch den Pfad von Nsight Compute zur PATH-Variable hinzufügen:
export PATH=/opt/nvidia/nsight-compute/${PATH:+:${PATH}}