Organisation des files d’attente

SLURM

  • La gestion des requêtes (job) se fait selon les ressources demandées par la requête (memoire,cpu(s), time limit,etc...).
  • SLURM contrôle les files d’attente, appelées ici QOS (=Quality Of Service).
  • Le lancement des jobs est organisé suivant la politique déterminée par l’administrateur et les ressources de la machine disponibles.

SLURM sur Olympe

  • Les informations ci-dessous sont susceptibles d’évoluer au cours du temps et en fonction de l’exploitation du système.
  • Les nœuds de calcul (36 cœurs) forment les briques élémentaires du système. Pour des jobs demandant plus de 36 cœurs, le nombre de cœurs réservés doit être un multiple de 36 .

ATTENTION : Ces valeurs sont mises à titre indicatif et peuvent être amenées à changer pendant la mise en production de la machine.

 

File d’attente nombre de cœurs nombre de nœuds nombre de gpus walltime jobs/user ram remarque Partition
mono moins de 18 1 0 400h 3 max 96 Go max 10 Go def non exclusif - HT Shared
nœud 36 1 0 250h 2 max 187 Go exclusif - HT Exclusive
nœud5 72 à 180 2 à 5 0 150h 2 max 187 Go/nœud exclusif - HT Exclusive
noeud10 216 à 360 6 à 10 0 110h 2 max 187 Go/nœud exclusif - HT Exclusive
noeud20 396 à 720 11 à 20 0 75h 1 max 187 Go/nœud exclusif - HT Exclusive
noeud40 756 à 1440 21 à 40 0 36h 1 max 187 Go/nœud exclusif - HT Exclusive
noeud50 1476 à 1800 41 à 50 0 24h 1 max 187 Go/nœud exclusif - HT Exclusive
visu 1 à 36 1 0 4h 1 max 50 Go max non exclusif - HT visu
mesca 1 à 18 1 0 100h 1 max 750 Go max non exclusif - HT mesca
voltam 1 à 18 1 1 à 2 100h 4 max 192 Go max 192 go def non exclusif - HT volta
volta 18 à 396 1 à 6 1 à 44 100h 2 max 377 Go max/noeud exclusif - HT volta

CPU

Partition exclusive ou partagée ?

  1. Pour une réservation de plus de 18 cœurs, les nœuds sont attribués dans leur intégralité (i.e les 36 cpus de chaque nœud sont réservés) : partition exclusive .

Pour une réservation totale de moins de 18 cœurs et de moins de 96 Go de mémoire (sur un seul nœud), et qui n’utilise pas les GPUs, le nœud est partagé entre plusieurs utilisateurs (sur la QOS "mono") : partition shared .

GPU

  1. Pour une réservation de plus de 18 cœurs, et/ou de plus de de 2 GPU les nœuds sont attribués dans leur intégralité (i.e les 36 cpus de chaque nœud sont réservés ainsi que les 4 GPU) : partition volta .
  2. Pour une réservation totale de moins de 18 cœurs et de moins de 96 Go de mémoire (sur un seul nœud), et de moins de de 2 GPU, le nœud est partagé entre plusieurs utilisateurs (QOS voltam) .

Décompte des heures cpu

Pour plus d’informations sur la manière dont sont décomptées les heures cpus, voir cet article.

Espace utilisateurs/Doc technique Olympe/Lancer un calcul

Voir aussi

FAQ

Questions fréquentes et messages d'erreurs

Lancer un calcul

Les différentes manières de lancer un calcul