Réservation des ressources (Exemple pour 1 nœud et 36 tâches MPI)
Il faut OBLIGATOIREMENT que votre script comporte à minima les informations suivantes :
Dans cet exemple on réserve 1 nœud, 36 tâches MPI durant 1 heure.
Le paramètre time
est optionnel mais très important, si on évalue correctement le temps d’exécution on a des chances de passer plus rapidement
Une liste non exhaustive d’options de réservation :
-J |
Nom du job |
-N |
Nombre de nœuds |
-n |
Nombre de tâches MPI |
--ntasks-per-node= |
Nombre de tà¢ches MPI par nœud (doit correspondre au nombre de total de tâches MPI divisé par le nombre de nœuds) |
--ntasks-per-core= |
Nombre de tâches MPI par cœur (Valeur à laisser à 1) |
--mem= |
Mémoire réservée par nœud en MegaBytes (Si cette option n’est pas spécifiée en en-tête du script, la totalité de la mémoire du nœud est allouée.) |
-o |
Le fichier dans lequel sera écrit la sortie standard |
-e |
Le fichier dans lequel seront écrits les messages d’erreur |
-t |
Le temps maximum pour lequel le job va tourner (Passé ce délai, le job est automatiquement arrêté.) |
--mail-user= |
Adresse mail à laquelle recevoir les notifications |
--mail-type= |
Cas de figure dans lesquels le mail est envoyé : BEGIN, END, FAIL, REQUEUE, and ALL. (Si cette option n’est pas spécifiée en en-tête du script, aucun mail ne sera envoyé.) |
Positionnement des variables d’environnement nécessaires au bon fonctionnement du script :
Création d’un dossier temporaire de calcul
Ce dossier se trouve sur tmpdir
, espace-disque rapide à grande capacité mais non sauvegardé
Rapatriement des résultats sous votre home directory
Cela permettra de mettre en sécurité vos fichiers de sortie, car le home directory est sauvegardé !
Pour obtenir des infos sur le job (durée occupation mémoire, etc ...)
RAPPELS
Soumission | sbatch votre_script_batch |
Etat | scontrol show job $JOBID |
Suppression | scancel $JOBID |