Recommandations de nommage et d’organisation
1. Notion de REMBI (Recommended Metadata for Biological Images)
Réutiliser les images et les données associées, à des fins d’étude ou de reproductibilité a toujours été un problème en imagerie, et particulièrement en microscopie. Une piste sur les métadonnées à acquérir pour chaque image a été théorisée dans la littérature (https://www.nature.com/articles/s41592-021-01166-8).
Les rédacteurs de l’article ont ajouté un tableau listant les différentes métadonnées et la façon de les associer, que l’on peut télécharger à cette adresse: http://bit.ly/rembi_v1
Selon le type de format d’image et le logiciel utilisé pour les générer, certaines seront encodées dans le fichier (telles que les informations de dimensions de l’image, du nombre de canaux, de taille de pixel…). D’autres métadonnées potentiellement utiles devront être écrites manuellement, sur cahier de labo ou dans un fichier séparé, avec le risque que celles-ci soient perdues.
2. Convention de nommage pour les groupes, projets, jeux de données, et images
En matière de projets de recherche, le framework ISA est de plus en plus utilisé pour l’organisation des données.
Ci-dessous une définition plus détaillée extraite de la documentation:
ISA is a metadata framework to manage an increasingly diverse set of life science, environmental and biomedical experiments that employ one or a combination of technologies. Built around the Investigation (the project context), Study (a unit of research) and Assay (analytical measurements) concepts, ISA helps you to provide rich descriptions of experimental metadata (i.e. sample characteristics, technology and measurement types, sample-to-data relationships) so that the resulting data and discoveries are reproducible and reusable.
En voici une traduction personnelle, pour les non-anglophones:
ISA est un standard de métadonnées applicable à divers types de données d’expériences scientifiques, environnementales, et biomédicales qui emploient une ou plusieurs technologies. Construit autour du concept d’Investigation (“Investigation”, le contexte du projet), d’Etude (“Study”, une unité standard de définition d’un projet de recherche), et Expérience (“Assay”, ou mesures analytiques), le standard ISA vous aidera à fournir des descriptions riches des métadonnées d’expérience (telles que les caractéristiques de l’échantillon, les technologies employées, les relations échantillon-données) afin que les données et découvertes obtenues soient reproductibles et réutilisables.
Grossièrement, cela pourrait être extrapolé de cette manière:
Groupe OMERO -> Projet (“Investigation”): “[N°unité-initiale du chef d’équipe-nom du porteur de projet]intitulé du projet”
Projet OMERO -> Etude (“Study”): “Initiale du prénom suivie du nom complet - titre du sous projet”
Dataset OMERO -> Jeu de données (“Assay”): “Date (année-mois-jour) - nom de la manip”
Image -> Manipulation: Pas de convention
3. Piste(s) d’organisation pour les métadonnées
OMERO est une piste pour aider à associer les métadonnées à leurs images respectives. Il est possible d’associer des métadonnées sous 3 formes:
- Tags (utile à des fins de recherche contextuelle)
- Dictionnaires (paires clé/valeur)
- Fichiers
Cela nécessitera de les entrer manuellement. OMERO.forms (https://doi.org/10.1101/109199) peut être utile pour créer un formulaire dédié à la saisie. Se poser la question de faire un formulaire bloquant si non rempli (si OMERO.forms le permet)
Type d’étude - Tag, dictionnaire Description de l’étude - Dictionnaire General dataset info (Auteurs, publications, licences…) - Dictionnaire Technique d’imagerie utilisée - Dictionnaire, tag (moindre mesure) Description du jeu de données - Dictionnaire, fichier séparé
Identité (numéro d’expérience, d’échantillon…) - Dictionnaire Entité Biologique - Tag, dictionnaire Organisme - Tag, dictionnaire Intrinsic variable (Intrinsic (e.g. genetic) alteration if applicable) - Dictionnaire Extrinsic variable (External biosample treatment (e.g. reagent) if applicable) - Dictionnaire +/- fichier Experimental variables (What is intentionally varied (e.g. time) between multiple entries in this study component) - Dictionnaire +/- fichier
Experimental status (Test/ control) - Dictionnaire Location within Biosample - Dictionnaire Preparation method - Dictionnaire +/- fichier de protocole Signal/contrast mechanism Channel - content Channel - biological entity
Instrument attributes Image acquisition parameters
Type Format & compression Dimension extents Size description Pixel/voxel size description Channel information Image processing method Contrast inversion to TEM QC info
Spatial and temporal alignment Fiducials used Transformation matrix/ other info Related images and relationship
Analysis result type Data used for analysis Analysis method and details
4. Utilisation du système de Tags
Omero ne comprend que deux niveaux de hiérarchie, vous allez donc créer de nombreux projets (groupe Omero) eux-mêmes pouvant contenir de nombreux dataset. Pour profiter au maximum d’OMERO, il est donc conseillé de prendre le temps d’annoter correctement les images (nom d’image et TAGs).
La liste de TAGs utilisée pour un projet doit être réfléchie et créée collectivement par les membres du projet. Une fois la dénomination d’un TAG identifiée, il est fortement conseillé de ne plus en changer.
L’ajout de TAGs peut se faire au moment de l’import des images ou à tout moment une fois les images importées et accessibles dans Omero.web.