Impact de l’arrêt du 12-13 Avril sur la soumission des Jobs / Olympe Shutdown Impact on Job Submission
Article mis en ligne le 29 mars 2021
dernière modification le 30 mars 2021

Nous mettons en place un dispositif spécifique, afin que vos jobs ne soient pas tués lors de l’arrêt.
En fonction de leur durée, certains jobs pourront être mis en attente jusqu’à la fin de la maintenance électrique.

Explications :

Pour l’arrêt d’Olympe du 12 Avril 2021 :

Si vous lancez un job qui risque de se terminer après StartTime, votre job restera en état PENDING jusqu’à la fin de la maintenance. Il sera automatiquement lancé après la maintenance.

Mais si vous pensez que votre job est suffisamment court pour se terminer AVANT le début de la réservation, vous pouvez ajuster convenablement sa durée en ajoutant l’option --time dans vos en-têtes sbatch.

AIDE

Pour vous aider à calculer le temps disponible avant la prochaine réservation vous pouvez utiliser la commande check-timelimit.sh :

Par exemple :

  1. Je sais qu’une maintenance est prévue bientôt.
  2. Je vérifie combien de temps il reste avec check-timelimit.sh, qui me renvoie 2-10:34:00 (2 jours, 10 heures, 34 mn avant l’arrêt)
  3. Si mon job est trop long, j’attends la fin de la maintenance
  4. Supposons que mon job soit prévu pour une vingtaine d’heures : pour avoir une chance de passer avant, J’introduis dans mon script sbatch la ligne suivante

Attention ! Dans tous les cas la valeur de durée ne peut dépasser les limites de WallTime imposées par les files d’attente : [https://www.calmip.univ-toulouse.fr/spip.php?article608]


In view of the Olympe shutdown on April 12 and 13, in order to avoid to kill jobs in progress during the shutdown, we are setting up a specific slurm reservation. This reservation may impact the submission of your jobs until the shutdown.

This reservation may impact the submission of your jobs until the shutdown.

EXPLANATIONS

For the shutdown on 12th April 2021 :

If you run a job that is likely to terminate after StartTime, your job will remain in the PENDING state until the maintenance ends. It will be automatically started after maintenance.

But if you think your job is short enough to end before the reservation starts, you can adjust its duration appropriately by adding the --time option in your sbatch headers.

HELP

To help you calculate the time available before the next reservation you can use the check-timelimit.sh command :

For example :

  1. I know there’s a maintenance scheduled soon.
  2. I check how much time is left with check-timelimit.sh, which returns 2-10:34:00 (2 days, 10 hours, 34 min before shutdown)
  3. If my job is too long, I wait for maintenance to finish
  4. Suppose my job is scheduled for about 20 hours : to have a chance of getting through before then, I insert the following line in my sbatch script

Warning ! In all cases the time value cannot exceed the WallTime limits imposed by the queues : [https://www.calmip.univ-toulouse.fr/spip.php?article608]