Organisation des files d’attente SLURM sur Olympe
Article mis en ligne le 21 juin 2018
dernière modification le 19 juillet 2018
logo imprimer

SLURM

  • La gestion des requêtes (job) se fait selon les ressources demandées par la requête (memoire,cpu(s), time limit,etc...).
  • SLURM contrôle les files d’attente, appelées ici QOS (=Quality Of Service).
  • Le lancement des jobs est organisé suivant la politique déterminée par l’administrateur et les ressources de la machine disponibles.

SLURM sur Olympe

  • Les informations ci-dessous sont susceptibles d’évoluer au cours du temps et en fonction de l’exploitation du système.
  • Les nœuds de calcul (36 cœurs / 192 go ram) forment les briques élémentaires du système. Pour des jobs demandant plus de 36 cœurs, le nombre de cœurs réservés doit être un multiple de 36 .
ATTENTION : Ces valeurs sont mises à titre indicatif et peuvent être amenées à changer pendant la mise en production de la machine.
File d’attente nombre de cœurs nombre de nœuds nombre de gpus walltime jobs/user ram remarque Partition
mono moins de 18 1 0 400h 3 max 96 Go max non exclusif - HT Shared
nœud 36 1 0 250h 2 max 192 Go exclusif - HT Exclusive
nœud5 72 à 180 2 à 5 0 150h 2 max 187 Go/nœud exclusif - HT Exclusive
noeud10 216 à 360 6 à 10 0 110h 2 max 187 Go/nœud exclusif - HT Exclusive
noeud20 396 à 720 11 à 20 0 75h 1 max 187 Go/nœud exclusif - HT Exclusive
noeud40 756 à 1440 21 à 40 0 36h 1 max 187 Go/nœud exclusif - HT Exclusive
noeud50 1476 à 1800 41 à 50 0 24h 1 max 187 Go/nœud exclusif - HT Exclusive
visu 1 à 36 1 0 4h 1 max 192 Go max non exclusif - HT visu
mesca 1 à 18 1 0 100h 1 max 750 Go max non exclusif - HT mesca
voltam 1 à 18 1 1 à 2 100h 1 max 192 Go max non exclusif - HT volta
volta 18 à 396 1 à 11 1 à 44 100h 1 max 377 Go max/noeud exclusif - HT volta

CPU

Partition exclusive ou partagée ?

  1. Pour une réservation de plus de 18 cœurs, les nœuds sont attribués dans leur intégralité (i.e les 36 cpus de chaque nœud sont réservés) : partition exclusive .
  2. Pour une réservation totale de moins de 18 cœurs et de moins de 96 Go de mémoire (sur un seul nœud), et qui n’utilise pas les GPUs, le nœud est partagé entre plusieurs utilisateurs (sur la QOS "mono") : partition shared .

    GPU

  1. Pour une réservation de plus de 18 cœurs, et/ou de plus de de 2 GPU les nœuds sont attribués dans leur intégralité (i.e les 36 cpus de chaque nœud sont réservés ainsi que les 4 GPU) : partition volta .
  2. Pour une réservation totale de moins de 18 cœurs et de moins de 96 Go de mémoire (sur un seul nœud), et de moins de de 2 GPU, le nœud est partagé entre plusieurs utilisateurs (QOS voltam) .

Décompte des heures cpu

Pour plus d’informations sur la manière dont sont décomptées les heures cpus, voir cet article.




Site réalisé sous SPIP
avec le squelette ESCAL-V3
Version : 3.87.86
Version Escal-V4 disponible pour SPIP3.2 Hébergeur : INP Toulouse