Pour lancer et suivre ses calculs sur Olympe

Lancer son calcul

sbatch mon_script.cmd

Quels jobs tournent ?

squeue -t RUNNING

Où en sont mes jobs ?

squeue -u $USER

La signification des colonnes:

JOBID identificateur SLURM du job
PARTITON Le nom de la partition
NAME nom du job
USER login utilisateur
STATE statut du job : R(running), PD(Pending->attente)
TIME durée depuis laquelle tourne le job
TIMELIMIT durée limite du run (d-hh:mm:ss)
QOS file d’attente SLURM
NODES nombre de nœuds réservés
NODELIST(REASON) liste des nœuds réservés

Pour obtenir des informations sur l’état d’un job en particulier :

scontrol show job $JOBID

Principales informations dispensées pour un job running :

QOS files d’attente SLURM
JobState statut du job : R(running), PD(Pending->attente)
RunTime durée depuis laquelle tourne le job
TimeLimit durée limite du run
SubmitTime date et heure de soumission du job
StartTime date et heure de début du run
NodeList liste des noeuds réservés

Arrêter son calcul

scancel $JOBID

 

Voir aussi

La frontale de connexion

Une fois que vous êtes connecté à Olympe, vous êtes sur l’une des trois frontales de connexion : olympelogin1 ou olympelogin2

Organisation des files d’attente

SLURM La gestion des requêtes (job) se fait selon les ressources demandées par la requête (memoire,cpu(s), time limit,etc...). SLURM contrôle les files d’attente, appelées ici QOS (=Quality Of Service)