AMBER
Article mis en ligne le 27 août 2018
dernière modification le 3 septembre 2018
logo imprimer

Version 16 (open mpi)

Compilé avec le compilateur intel, cuda 9.1 et openmpi - Version recommandée

Faut-il utiliser les GPUs avec amber ?

La réponse est oui, sans aucune ambiguïté : la configuration la plus efficace est l’utilisation d’un seul nœud et des 4 GPUs du nœud. On utilisera seulement 4 processus, donc 4 cœurs des processeurs.

Pour des données comportant 250000 atomes, le graphique ci-dessous montre les performances obtenues en utilisant :

  • Un nœud et 1, 2 ou 4 GPUs (courbe bleue)
  • 1, 2, ou 4 nœuds sans GPU (courbe rouge)

PNG

Exemples de scripts sbatch

Un script sbatch qui tourne sur 1 nœud GPU :

Vérifier que le job tourne correctement

Lorsque votre job amber est en état RUNNING, nous vous conseillons de vérifier que tout se passe correctement grâce à la commande :

Pour un appel amber on devrait avoir la sortie suivante :

On voit que :

  1. Les 4 processus se répartissent correctement sur les deux processeurs
  2. Les 4 GPUS sont utilisés (80 à 95% de taux d’utilisation)
  3. 19% de la mémoire des GPUs est utilisée
  4. Chaque CPU "voit" les quatre processus, mais sa mémoire est utilisée essentiellement par l’un d’entre eux : en fait les processes tournant sur les GPUs communiquent entre eux, il y a donc des tampons d’entrée-sortie sur chaque GPU pour tous les processus.

On peut comparer cette sortie à celle obtenue pour gromacs.




Site réalisé sous SPIP
avec le squelette ESCAL-V3
Version : 3.87.86
Version Escal-V4 disponible pour SPIP3.2 Hébergeur : INP Toulouse