reseau:cloud:proxmox:lxcnvidia
Différences
Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
| reseau:cloud:proxmox:lxcnvidia [2026/03/30 14:25] – [SOLUTION OFFICIELLE POUR PROXMOX 9 + DEBIAN 13] techer.charles_educ-valadon-limoges.fr | reseau:cloud:proxmox:lxcnvidia [2026/03/30 15:08] (Version actuelle) – [Nvidia dans le Container LXC] techer.charles_educ-valadon-limoges.fr | ||
|---|---|---|---|
| Ligne 149: | Ligne 149: | ||
| AF:00.0 NVIDIA Corporation TU104GL [Tesla T4] | AF:00.0 NVIDIA Corporation TU104GL [Tesla T4] | ||
| B0:00.0 NVIDIA Corporation TU104GL [Tesla T4] | B0:00.0 NVIDIA Corporation TU104GL [Tesla T4] | ||
| + | </ | ||
| + | |||
| + | * vérifier que CUDA voit les deux cartes | ||
| + | |||
| + | < | ||
| + | # nvidia-smi -L | ||
| + | GPU 0: Tesla T4 (UUID: GPU-e5bc6842-5aa8-b29e-aa13-922b15c893f9) | ||
| + | GPU 1: Tesla T4 (UUID: GPU-6ac33a99-2cb8-eb7d-6097-f1c29e4d1e51) | ||
| </ | </ | ||
| Ligne 200: | Ligne 208: | ||
| * GPU 1 → 0000: | * GPU 1 → 0000: | ||
| - | ==== Problème Debian 13 + NVIDIA 590 pour les cartes Testla T4 ==== | + | * lancer un benchmark PCIe / mémoire |
| - | Debian 13 (Trixie) est en version Testing, et utilise : | + | < |
| - | * un kernel 6.7 / 6.8 / 6.17 selon build Proxmox | + | # nvidia-smi topo -m |
| - | * libdrm, libglvnd, libnvidia-ml plus récentes que Debian 12 | + | |
| - | * NVIDIA driver branche 590.xx (pas encore stabilisée multi-GPU) | + | GPU0 |
| + | GPU1 NODE | ||
| - | Sous Debian 13 + kernel récent, on observe | + | Legend: |
| - | * Le kernel NVIDIA voit les deux GPU => (/ | + | |
| - | * NVML (bibliothèque utilisée par nvidia-smi) ne recense qu’un seul GPU | + | |
| - | * => nvidia-smi n’affiche qu’un GPU | + | |
| - | * => topo -m n’affiche qu’un GPU | + | |
| - | * => nvidia-smi -i 1 = No devices found | + | |
| - | ==== SOLUTION OFFICIELLE POUR PROXMOX 9 + DEBIAN 13 ==== | + | X |
| - | + | SYS | |
| - | | + | NODE = Connection traversing PCIe as well as the interconnect between PCIe Host Bridges within a NUMA node |
| - | + | PHB | |
| - | La branche 550 est compatible Debian 13 et ne souffre pas du bug NVML. | + | PXB |
| + | PIX | ||
| + | | ||
| + | </ | ||
| < | < | ||
| - | # apt remove | + | # nvidia-smi -i 0 |
| - | # apt autoremove | + | Mon Mar 30 14:49:26 2026 |
| - | # reboot | + | +-----------------------------------------------------------------------------------------+ |
| + | | NVIDIA-SMI 595.58.03 | ||
| + | +-----------------------------------------+------------------------+----------------------+ | ||
| + | | GPU Name | ||
| + | | Fan Temp | ||
| + | | | ||
| + | |=========================================+========================+======================| | ||
| + | | | ||
| + | | N/A | ||
| + | | | ||
| + | +-----------------------------------------+------------------------+----------------------+ | ||
| + | +-----------------------------------------------------------------------------------------+ | ||
| + | | Processes: | ||
| + | | GPU | ||
| + | | ID | ||
| + | |=========================================================================================| | ||
| + | | No running processes found | | ||
| + | +-----------------------------------------------------------------------------------------+ | ||
| </ | </ | ||
| - | * Télécharger | + | * charger |
| < | < | ||
| - | # wget https:// | + | # nvidia-smi --query-gpu=utilization.gpu --format=csv |
| - | # chmod +x NVIDIA-Linux-x86_64-550.127.05.run | + | |
| </ | </ | ||
| - | * Lancer l’installation DKMS | + | * charger le GPU 1 |
| < | < | ||
| - | # ./NVIDIA-Linux-x86_64-550.127.05.run | + | # nvidia-smi --query-gpu=utilization.gpu --format=csv |
| - | + | ||
| - | Répondre : | + | |
| - | + | ||
| - | “yes” pour DKMS | + | |
| - | “no” pour nouveau (il sera blacklisté automatiquement) | + | |
| </ | </ | ||
| - | |||
| - | * Puis : | ||
| - | |||
| - | < | ||
| - | apt install nvidia-driver-550 | ||
| - | reboot | ||
| - | </ | ||
| - | |||
| - | = driver stable, multi-GPU, compatible T4 / CUDA 12 / CUDA 13. | ||
| - | |||
| ===== Nvidia dans le Container LXC ===== | ===== Nvidia dans le Container LXC ===== | ||
| Ligne 275: | Ligne 283: | ||
| {{ : | {{ : | ||
| {{ : | {{ : | ||
| + | |||
| + | <WRAP center round info > | ||
| + | Ne plus installer le périphéirque **/ | ||
| + | </ | ||
| * Installez les drivers nvidia et la suite logicielle **cuda** dans le conteneur LXC (procédure semblable à celle de l'hote Proxmox). | * Installez les drivers nvidia et la suite logicielle **cuda** dans le conteneur LXC (procédure semblable à celle de l'hote Proxmox). | ||
reseau/cloud/proxmox/lxcnvidia.1774873511.txt.gz · Dernière modification : 2026/03/30 14:25 de techer.charles_educ-valadon-limoges.fr
