Lancer un calcul sur Turpan

Partition / global = 3 jobs max par utilisateur :

  • small : exclusive, 2 jobs max, pas plus de 6 noeuds par jobs, max walltime par job 4H
  • big : exclusive, 1 job max, pas plus de 13 noeuds par jobs, max walltime par job 2H
  • full : exclusive, 1 job max, au moins 14 noeuds par jobs, max walltime par job 20H
  • shared : non exclusive, 2 jobs max, pas plus de 1 GPU, 40 cpu et 256G ram par jobs, max walltime par job 4H
  • visu : non exclusive, 1 job max, max 50Go RAM max 8 cpu par job, max walltime par job 4H

Comment lancer un script sbatch ?

Exemple script exclusif, 2 nœuds, 160 processeurs, le temps d'exécution moins de 4H

#!/bin/bash
#SBATCH -N 2
#SBATCH -n 160
#SBATCH --gres=gpu:2 
#SBATCH -p small
#SBATCH --ntasks-per-node=80
#SBATCH --time=00:10:00

module purge
module load gnu/11.2.0
module load openmpi/gnu/4.1.4-gpu

nodeset -e ${SLURM_JOB_NODELIST} | tr ' ' '\n' > hostfile_${SLURM_JOBID}
mpirun -hostfile ./hostfile_${SLURM_JOBID} -n 160 ./exec

Exemple script shared, 1 nœud, 40 processeurs,  le temps d'exécution moins de 4H

#!/bin/bash
#SBATCH -N 1
#SBATCH -n 40
#SBATCH --gres=gpu:1
#SBATCH -p shared
#SBATCH --ntasks-per-node=40
#SBATCH --time=00:10:00

module purge
module load gnu/11.2.0
module load openmpi/gnu/4.1.4-gpu

mpirun -n 40 ./exec