Script SLURM pour une réservation de PLUS de 18 cœurs
Article mis en ligne le 21 juin 2018
dernière modification le 19 juillet 2018
logo imprimer

Réservation des ressources (Exemple pour 1 nœud et 36 tâches MPI)

Il faut OBLIGATOIREMENT que votre script comporte à minima les informations suivantes :

Dans cet exemple on réserve 1 nœud, 36 tâches MPI durant 1 heure.
Le paramètre time est optionnel mais très important, si on évalue correctement le temps d’exécution on a des chances de passer plus rapidement

Une liste non exhaustive d’options de réservation :

-J Nom du job
-N Nombre de nœuds
-n Nombre de tâches MPI
--ntasks-per-node= Nombre de tà¢ches MPI par nœud (doit correspondre au nombre de total de tâches MPI divisé par le nombre de nœuds)
--ntasks-per-core= Nombre de tâches MPI par cœur (Valeur à laisser à 1)
--mem= Mémoire réservée par nœud en MegaBytes (Si cette option n’est pas spécifiée en en-tête du script, la totalité de la mémoire du nœud est allouée.)
-o Le fichier dans lequel sera écrit la sortie standard
-e Le fichier dans lequel seront écrits les messages d’erreur
-t Le temps maximum pour lequel le job va tourner (Passé ce délai, le job est automatiquement arrêté.)
--mail-user= Adresse mail à laquelle recevoir les notifications
--mail-type= Cas de figure dans lesquels le mail est envoyé : BEGIN, END, FAIL, REQUEUE, and ALL. (Si cette option n’est pas spécifiée en en-tête du script, aucun mail ne sera envoyé.)

Positionnement des variables d’environnement nécessaires au bon fonctionnement du script :

Création d’un dossier temporaire de calcul

Ce dossier se trouve sur tmpdir, espace-disque rapide à grande capacité mais non sauvegardé

Votre script à exécuter

En utilisant IntelMPI  :

  • avec la commande srun : ---> Cas préconisé par CALMIP
  • avec la commande mpiexec.hydra :
  • avec la commande mpiexec :
  • NE PAS UTILISER LA COMMANDE mpirun :

En utilisant openMPI :

  • avec la commande srun :
  • avec la commande mpirun :

Rapatriement des résultats sous votre home directory
Cela permettra de mettre en sécurité vos fichiers de sortie, car le home directory est sauvegardé !

Pour obtenir des infos sur le job (durée occupation mémoire, etc ...)


RAPPELS

Soumission sbatch votre_script_batch
Etat scontrol show job $JOBID
Suppression scancel $JOBID



Site réalisé sous SPIP
avec le squelette ESCAL-V3
Version : 3.87.86
Version Escal-V4 disponible pour SPIP3.2 Hébergeur : INP Toulouse