Vous êtes ici : Accueil > Espace Utilisateurs > Utilisation du système de calcul EOS > Lancer un calcul sur EOS > Script SLURM pour une réservation de PLUS de 10 cores
Par : LB
Publié : 25 juin 2014

Script SLURM pour une réservation de PLUS de 10 cores

Réservation des ressources (Exemple pour 1 nœud et 20 tâches MPI)

Il faut OBLIGATOIREMENT que votre script comporte à minima les informations suivantes :

Dans cet exemple on réserve 1 nœud, 20 tâches MPI durant 1 heure.
Le paramètre time est optionnel mais important, si on évalue correctement le temps d’exécution on a des chances de passer plus rapidement

Une liste non exhaustive d’options de réservation :

-J Nom du job
-N Nombre de nœuds
-n Nombre de tâches MPI
--ntasks-per-node= Nombre de tâches MPI par nœud (doit correspondre au nombre de total de tâches MPI divisé par le nombre de nœuds)
--ntasks-per-core= Nombre de tâches MPI par core (Valeur à laisser à 1)
--mem= Mémoire réservée par nœud en MegaBytes (Si cette option n’est pas spécifiée en en-tête du script, la totalité de la mémoire du nœud est allouée.)
-o Le fichier dans lequel sera écrit les sorties
-e Le fichier dans lequel sera écrit les messages d’erreur
-t Le temps maximum pour lequel le job va tourner (Passé ce délai, le job est automatiquement arrêté.)
--mail-user= Adresse mail à laquelle recevoir les notifications
--mail-type= Cas de figure dans lesquels le mail est envoyé : BEGIN, END, FAIL, REQUEUE, and ALL. (Si cette option n’est pas spécifiée en en-tête du script, aucun mail ne sera envoyé.)

Positionnement des variables d’environnement nécessaires au bon fonctionnement du script :

Création d’un dossier temporaire de calcul

Ce dossier se trouve sur tmpdir, espace-disque rapide à grande capacité mais non sauvegardé

Votre script à exécuter

En utilisant IntelMPI  :

  • avec la commande srun : ---> Cas préconisé par CALMIP
    ATTENTION : si vous oubliez la première ligne, votre job se lancera quand même, et tournera indéfiniment...
  • avec la commande mpiexec.hydra :
  • avec la commande mpirun :
  • avec la commande mpiexec :

En utilisant BullxMPI :

  • avec la commande srun :
  • avec la commande mpirun :

Rapatriement des résultats sous votre home directory
Cela permettra de mettre en sécurité vos fichiers de sortie, car le home directory est sauvegardé !

Pour obtenir des infos sur le job (durée occupation mémoire, etc ...)


RAPPELS

Soumission sbatch votre_script_batch
État scontrol show job $JOBID
Suppression scancel $JOBID