Olympe : FIN incident /tmpdir (01/06/2026)

Soumis par Nicolas renon le


L'accès à l'espace /tmpdir a été rétabli.

Pendant le WE la connexion entre le système de fichier Lustre (/tmpdir) et les noeuds de calculs de Olympe
a été interrompue. Ceci a rendu l'espace /tmpdir inaccessible.

Un des serveurs de stockage participant au système de fichier est actuellement offline. 
Ceci peut avoir un impact (évalué à faible ou moyen) sur la performance des lecture/écriture, mais pas sur l'intégrité des données.

Nous travaillons actuellement avec les équipes de Bull sur la remise en production de ce serveur de stockage. 
Nous travaillons également sur les mesures permettant de contribuer à la stabilisation du système de fichier qui porte l'espace /tmpdir.
Pour rappel les matériels de stockage ont été mis en production mi-2018. 

Nous sommes désolé pour cet incident et nous vous remercions pour votre compréhension.

Bien Cordialement

*************************

 

Bonjour à toutes et tous, 

Nous avons un nouvel incident en cours sur l'espace /tmpdir d'Olympe. 
L'accès aux données est très perturbés. 

A priori, cet incident ne devrait pas engendrer de perte de données, au moins pour celles qui résidaient sur le /tmpdir avant ce nouvel incident. 
Il se peut que des données en cours d'écriture soient impactées. 

Nous travaillons activement avec les équipes de Bull à la résolution du problème et aux solutions de stabilisation de la disponibilité du /tmpdir dans la durée. 

Désolé pour ce nouvel désagrément et merci pour votre patience et votre compréhension. 

Bien Cordialement

 

***** 27/05/2028*******

Chères utilisatrices, Chers utilisateurs,

Le système de stockage /tmpdir est de nouveau opérationnel.
Les connexions au Supercalculateur Olympe sont réouvertes.

Le système de stockage a eu un fonctionnement dégradé depuis hier en fin de journée. 
L'accès aux données a été en conséquence très perturbés. 
Le système de stockage a été remis en fonctionnement nominal grâce à l'aide des équipes Bull. 

A priori, cet incident n'a pas engendré de perte de données, au moins pour celles qui résidaient sur le /tmpdir avant cet incident. 
Il se peut que des données qui étaient en cours d'écriture pendant l'incident aient été impactées.

Nous sommes désolés pour le désagrément et nous vous remercions de votre compréhension.

Bien Cordialement
Equipe Calmip

**********

Bonjour,

Nous avons un potentiel problème en cours sur Olympe (/tmpdir).
Nous revenons vers vous rapidement.

merci de votre compréhension.

Bien Cordialement