Glossaire, concepts utiles et vocabulaire
Article mis en ligne le 6 janvier 2020

Glossaire, concepts utiles et vocabulaire

Elaborer un panorama complet de la gestion des données, la science ouverte et l’interopérabilité dépasse bien sûr largement le cadre de cette page Web. Cela nécessiterait beaucoup de livres à lire et un temps d’apprentissage conséquent. Cette page ne couvre que la définition très élémentaire des concepts clés, et indique quelques outils et des liens vers des documentations plus complètes pour vous aider à mieux comprendre la portée générale de la gestion des données.

Ressources liées aux DMPs
Comprendre les principes FAIR (Findable, Accessible, Interoperable, Reusable).
La page dédiée du site Web de Zenodo présente un aperçu complet des principes FAIR.
Opidor est un outil (francophone) de gestion des données scientifiques, disponible en ligne.
Il offre un ensemble de modèles pour les plans de gestion de données.
Il présente également une interface en ligne pour l’écriture de DMPs (authentification requise).
Une liste des services liés au cycle de vie des données est également fournie.

Archives de données, stockage de données
EOSC est (ou est destiné à devenir) le principal portail web pour la science ouverte européenne. Il vise à fournir un point d’accès fédéré pour de nombreux services. Zenodo permet le partage d’ensembles de données scientifiques.

Métadonnées, interopérabilité et moissonnage
Comprendre les mécanismes de collecte de métadonnées
Le site Web de l’initiative d’archives ouvertes (OAI) présente les concepts de base de l’interopérabilité des contenus Web. Il donne également un aperçu des mécanismes de collecte de métadonnées, ainsi qu’une description détaillée des protocoles OAI et des normes de métadonnées que ces protocoles utilisent pour la diffusion des données. L’utilisation des métadonnées Dublin Core (également disponibles sous forme d’ontologie) est obligatoire pour utiliser le protocole PMH de l’OAI.
L’interopérabilité elle-même, cependant, est une question beaucoup plus vaste que la description des métadonnées et la collecte des référentiels. Avant d’entrer (un peu) plus en détail, il peut être utile de préciser deux initiatives majeures, à savoir OGC et IVOA qui ont construit un ensemble solide de normes, de protocoles et de logiciels pertinents pour leurs communautés scientifiques.

Pour la communauté géospatiale
L’OGC (Open Geospatial Consortium) se consacre à la définition de normes et de protocoles pour la description et l’accès aux données géospatiales.
Une liste des produits correspondants est disponible sur le site Web de l’OGC.
Une application complète mettant en œuvre de nombreuses normes de l’OGC est téléchargeable et utilisable gratuitement : Son nom est GeoServer.

Pour l’astrophysique
L’Alliance internationale d’observatoires virtuels (IVOA) offre à l’astrophysique le même ensemble de fonctionnalités que l’OGC offre pour les données géospatiales.

Interopérabilité, EIF et ontologies
L’interopérabilité est un vaste domaine de recherche qui ne se limite pas à l’interopérabilité des données, mais s’applique également aux logiciels, aux produits et aux processus industriels par exemple. La Commission européenne a adopté en 2017 un cadre d’interopérabilité qui couvre de nombreux aspects.
En 2006, le rôle des ontologies dans l’interopérabilité avait déjà été clairement énoncé par David Chen (CHEN, David. Enterprise Interoperability Framework. In : EMOI-INTEROP. 2006.) dans le cadre d’EIF, qui peut également s’appliquer aux données scientifiques. Les ontologies jouent un rôle clé dans l’extraction des besoins d’interopérabilité des services ou des données et dans la fourniture d’une interopérabilité "fédérée" (le type d’interopérabilité qui ne nécessite pas de modification native des données, ni de conformité à un méta-modèle prédéfini).
Cependant, la définition d’une ontologie pour des données spécifiques est une tâche exigeante, qui nécessite des compétences multiples dans le cadre d’un processus collaboratif. Heureusement, il est souvent possible de trouver des ontologies pertinentes pour un domaine de connaissance, ou des ontologies de "haut niveau" utiles pour fournir un cadre générique pour des ontologies de tâche ou de domaine.
L’ontologie biologique et biomédicale ouverte (OBO) fournit non seulement des ontologies pour les domaines liés à la biologie, mais aussi des ontologies de haut niveau adaptées à de nombreux autres domaines.

Ontologie formelles de haut niveau :
BFO, SUMO et DOLCE sont des exemples d’ontologies de haut niveau qui valent la peine d’être étudiées avant de se lancer dans le travail de composition d’une ontologie.
Des informations plus complètes sur les ontologies sont disponibles sur le site Web du W3C.