Zum Inhalt springen

NVIDIA-GPU-Treiber installieren

Zuletzt aktualisiert am

In dieser Anleitung lernen Sie, wie Sie Treiber für NVIDIA-GPU-Maschinentypen installieren:

Sie können die NVIDIA-Treiber über den Paketmanager auf der Linux-Distribution Ihres Host-Systems installieren. Die aktuellen Distributionen, aus denen Sie wählen können, finden Sie in der NVIDIA-Dokumentation. Für das folgende Beispiel verwenden wir Ubuntu & Fedora sowie den APT-Paketmanager. Für andere Linux-Distributionen konsultieren Sie bitte die offizielle Website für das CUDA-Toolkit.

  1. Installieren Sie den öffentlichen GPG-Schlüssel des CUDA-Repositorys. Führen Sie die folgenden Befehle nacheinander aus.

    Terminal-Fenster
    wget [https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-keyring_1.1-1_all.deb](https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-keyring_1.1-1_all.deb)
    sudo dpkg -i cuda-keyring_1.1-1_all.deb
    sudo apt-get update
  2. Installieren Sie den Treiber.

    Terminal-Fenster
    sudo apt-get install -y nvidia-open
  3. Installieren Sie den Fabric-Manager (nur für den Maschinentyp n3.104d.g8). Der Fabric-Manager ist notwendig, um die Verbindung mehrerer GPUs mit NVIDIA NVSwitch zu nutzen.

    Terminal-Fenster
    # Der Treiber und der Fabric-Manager sollten die gleiche Version haben, z. B. Version 560:
    sudo apt install nvidia-fabricmanager-560
    # Starten Sie Ihre Maschine neu:
    sudo reboot
    Starten Sie den Fabric-Manager:
    sudo systemctl start nvidia-fabricmanager

So verwenden Sie das NVIDIA System Management Interface (SMI)

Abschnitt betitelt „So verwenden Sie das NVIDIA System Management Interface (SMI)“

nvidia-smi (auch NVSMI) bietet Überwachungs- und Verwaltungsfunktionen für alle NVIDIA-Architekturfamilien. Es wird zusammen mit den offenen NVIDIA-Treibern und dem CUDA-Toolkit bereitgestellt. Ein Beispiel für eine NVSMI-Ausgabe:

Terminal-Fenster
nvidia-smi
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 565.57.01 Driver Version: 565.57.01 CUDA Version: 12.7 |
|-----------------------------------------+------------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=========================================+========================+======================|
| 0 NVIDIA A100 80GB PCIe On | 00000000:05:00.0 Off | 0 |
| N/A 31C P0 45W / 300W | 1MiB / 81920MiB | 0% Default |
| | | Disabled |
+-----------------------------------------+------------------------+----------------------+
+-----------------------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=========================================================================================|
| Keine laufenden Prozesse gefunden |
+-----------------------------------------------------------------------------------------+
## So führen Sie Aktionen nach der Installation durch
Bevor Sie das CUDA-Toolkit und den Treiber verwenden können, müssen Sie die folgenden Schritte durchführen. Der erste ist das Hinzufügen des Installationspfads zu Ihrer **PATH**-Variable. Wenn Sie die `.run`-Installationsmethode verwendet haben, führen Sie einfach den folgenden Befehl aus. Im folgenden Beispiel verwenden wir `cuda-12.2`:
```bash
export PATH=/usr/local/cuda-12.2/bin${PATH:+:${PATH}}

Für die runfile-Installation müssen Sie auch den oben verwendeten Pfad zu LD_LIBRARY_PATH hinzufügen. Im Folgenden verwenden wir “cuda-12.2” als Beispiel:

Terminal-Fenster
# For 64-bit operating systems:
export LD_LIBRARY_PATH=/usr/local/cuda-12.2/lib64\
${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
# For 32-bit operating systems:
export LD_LIBRARY_PATH=/usr/local/cuda-12.2/lib\
${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

Wenn Sie einen der Paketmanager verwendet haben, müssen Sie auch den Pfad von Nsight Compute zur PATH-Variable hinzufügen:

Terminal-Fenster
export PATH=/opt/nvidia/nsight-compute/${PATH:+:${PATH}}