Vous êtes ici : Accueil > Espace Utilisateurs > Utilisation du système de calcul EOS > Lancer un calcul sur EOS > Organisation des files d’attente SLURM sur EOS
Par : Webmaster
Publié : 25 juin 2014

Organisation des files d’attente SLURM sur EOS

SLURM

  • La gestion des requêtes (job) se fait selon les ressources demandées par la requête (memoire,cpu(s), time limit,etc...).
  • SLURM contrôle les files d’attente, appelées ici QOS (=Quality Of Service).
  • Le lancement des jobs est organisé suivant la politique déterminée par l’administrateur et les ressources de la machine disponibles.

SLURM sur EOS

  • Les informations ci-dessous sont susceptibles d’évoluer au cours du temps et en fonction de l’exploitation du système.
  • Les nœuds de calcul (20 cœurs / 64 go ram) forment les briques élémentaires du système. Pour des jobs demandant plus de 20 cœurs, le nombre de cœurs réservés doit être un multiple de 20 (sauf dans le cas de la qos mesca).
ATTENTION : Ces valeurs sont mises à titre indicatif et peuvent être amenées à changer pendant la mise en production de la machine.
File d’attente nombre de cœurs nombre de nœuds walltime jobs/user ram remarque Partition
mono moins de 10 1 400h 3 max 32 Go max non exclusif - HT Shared
nœud 20 1 300h 3 max 60 Go exclusif - HT Exclusive
nœud9 40 à 180 2 à 9 200h 2 max 60 Go/nœud exclusif - HT Exclusive
noeud18 200 à 360 10 à 18 150h 2 max 60 Go/nœud exclusif - HT Exclusive
noeud36 380 à 720 19 à 36 100h 1 max 60 Go/nœud exclusif - HT Exclusive
noeud72 740 à 1440 37 à 72 48h 1 max 60 Go/nœud exclusif - HT Exclusive
noeud90 1460 à 1800 73 à 90 36h 1 max 60 Go/nœud exclusif - HT Exclusive
visu 1 à 20 1 2h 1 max 126 Go max non exclusif - HT visu
mesca 1 à 64 1 100h 1 max 1 To max non exclusif mesca

La file d’attente mesca concerne nœud à grande capacité mémoire.

Le nœud à grande capacité Mémoire Eosmesca1 (QOS : mesca) remplace le nœud UVPROD (QOS : uvprod). Le noeud UVPROD sera arrêté avant la fin de l’année 2015.


Partition exclusive ou partagée ?

  1. Pour une réservation de plus de 10 cœurs, les nœuds sont attribués dans leur intégralité (i.e les 20 cpus de chaque nœud réservé) → partition exclusive .
  2. Pour une réservation totale de moins de 10 cœurs et de moins de 32 Go de mémoire (sur un seul nœud), le nœud est partagé entre plusieurs utilisateurs (sur la QOS "mono") → partition shared .

Décompte des heures cpu

Pour plus d’informations sur la manière dont sont décomptées les heures cpus, voir cet article.