Publication des échelles phénologiques sur le Web

Découvrez grâce à ce retour d’expérience comment les échelles phénologiques deviennent accessibles et comparables grâce aux technologies du Web sémantique. Explorez les outils et méthodes qui facilitent leur publication et leur réutilisation sur le Web.

Une collaboration entre les unités INRAE (MISTEA, AGAP, MAIAGE, DipSO), Cnrs (CEFE), le CATI CODEX, l’entreprise Elzeard, l’Institut Français du Vin (IFV), l’institut Terres Inovia et l’ACTA.  

Un enjeu en agronomie : créer un cadre méthododologique pour la description des stades phénologiques des plantes cultivées

Gros plan sur une inflorescence qui apparait au sommet d'un rameau de vigne.L’étude phénologique d’une plante consiste à observer à quelle date les stades apparaissent. Un stade phénologique, ou stade de développement des plantes, caractérise une phase de développement de la plante pendant son cycle de vie.  Les variations temporelles sur l’apparition d’un stade peuvent dépendre du climat ou d’autres facteurs comme la variété de la plante. Une échelle phénologique est un ensemble de stades. Plusieurs échelles phénologiques existent par espèce cultivée, par exemple BBCH,  Eichhorn-Lorenz, Bagglioni, IFV Epicure et IFV label pour la vigne. L’échelle phénologique BBCH améliorée (Biologische Bundesanstalt, Bundessortenamt und CHemische Industrie) propose une codification homogène des stades de développement communs à différentes espèces végétales cultivées. BBCH décrit plusieurs échelles : l’échelle générale et des échelles spécifiques par culture (dites « échelles individuelles »). 

Le projet ANR « Des Données aux Connaissances en Agronomie et Biodiversité » (D2KAB) puis le projet CASDAR  « Standardiser les données expérimentales et techniques pour faciliter leur réutilisation et accélérer l’innovation et le développement agricole : application aux travaux sur les biosolutions » (STAR) ont créé un cadre méthodologique pour la description sémantique des stades de développement des plantes fondé sur l’ontologie « BBCH-based Plant Phenological Description Ontology » (PPDO). L’Institut Français de la Vigne et du vin (IFV) et Terres Inovia ont aligné leurs échelles internes existantes avec les échelles BBCH.

L’objectif principal de ce travail est de mettre à disposition les échelles phénologiques standardisées et leurs stades de développement pour en faciliter la réutilisation et la comparaison. En alignant ces échelles, nous permettons de consolider les observations phénologiques provenant de multiples sources et acteurs, même si ces sources sont variées et hétérogènes. Ainsi des sources de données multiples et hétérogènes contenant des observations phénologiques pourront être comparées dans le but d’étudier par exemple le comportement des végétaux face aux changements climatiques.

Mise en oeuvre de la méthode Linked Open Terms pour produire l’ontologie PPDO et les graphes des échelles par culture

Nous avons réutilisé et adapté la méthode Linked Open Terms (LOT) de publication des données sur le Web à l’aide des technologies Web Sémantique. Tout d’abord l’ontologue a produit l’ontologie « BBCH-based Plant Phenological Description Ontology » (PPDO) pour définir un schéma de représentation unifiée des échelles et de leurs stades fondée sur la codification BBCH. Ensuite, les agronomes ont cherché des sources de référence publiées dans des revues techniques ou scientifiques décrivant les échelles de leur choix. A partir de ces sources, les agronomes ont ensuite ont enrichi ou corrigé les définitions en langue naturelle des différents stades dans des fichiers CSV conçus par l’ontologue. Ce dernier a ensuite collaboré avec les agronomes pour aligner entre eux les stades des échelles d’une même culture. Des diagrammes ont été réalisés pour documenter les alignements, comme le montre la Figure 1.

Développement d’un connecteur entre vocabulaires contrôlés et entrepôt de données

Etat des lieux

Les équipes responsables de Data INRAE (développeur et curateur de l’entrepôt) ont observé la faible quantité et qualité des mots-clés décrivant les jeux de données. En effet, cette métadonnée n’étant pas obligatoire et le mode de saisie complexe (4 champs à remplir par mot-clé), elle était souvent ignorée ou mal remplie. Des comptages ont été réalisés via l’API de Recherche Data Gouv qui ont permis de confirmer les observations des équipes Data INRAE (cf. fig 3) : moins de 50 % des jeux de données en 2019, 2020 et 2021 contiennent des mots-clés, on note une progression avec 74 % en 2022 et 63 % en 2023, lorsqu’elle est remplie c’est majoritairement avec des termes « libres » c’est-à-dire non référencés dans un vocabulaire contrôlé (<10 % par année des jeux de données avec un référencement complet (‘ref complet’ sur la figure) entre 2018 et 2022, on note une faible progression à 15 % en 2023).

Solution mise en place

Un connecteur  (autrement appelé MAS – Metadata Annotation System) entre Data INRAE et AgroPortal a donc été conçu, déployé et paramétré pour répondre au besoin de simplification du remplissage de la métadonnée « mots-clés ». L’utilisateur saisit son mot-clé et si ce terme existe dans un vocabulaire connecté, les informations associées à ce terme dans le vocabulaire (identifiant, synonymes et traductions) sont récupérées via le connecteur et intégrées dans les métadonnées.

L’architecture du connecteur et la liste des vocabulaires branchés sont présentés ci-après :

Figure 1: Architecture du connecteur et liste des vocabulaires branchés

Pour valider l’approche et affiner les paramétrages, des tests utilisateurs ont été réalisés, pour une première version de la fonctionnalité, sur un panel de testeurs ayant des profils variés : curateur Data INRAE, administrateur de collection, Référent Données, déposants de Data INRAE. Ces tests visaient à identifier la façon dont les utilisateurs de Data INRAE interagissent avec le formulaire de saisie de métadonnées et le module de recherche de jeux de données. Des entretiens individuels ont eu lieu en visioconférence dans un format semi-dirigé, c’est-à-dire que des « missions » étaient confiées au testeur, qu’il devait compléter librement (cf. Tableau 1).

Une première version de ce connecteur a été mise en production le 2 octobre 2024, dans la partie Data INRAE de l’entrepôt Recherche Data Gouv.

Une nouvelle interface utilisateur

Sur le portail Data INRAE, le connecteur prend désormais la forme d’un champ de saisie unique quand l’ancienne interface en contenait quatre. L’utilisateur sélectionne un mot-clé appartenant à un vocabulaire ou, s’il n’en trouve pas, peut utiliser la saisie libre. Un bouton « développer tous les champs » permet à des utilisateurs plus experts de saisir des termes issus d’autres vocabulaire que ceux branchés au connecteur, en précisant manuellement leurs URI, le nom du vocabulaire source et son URL.

Figure 2 : maquette du connecteur et de ses paramètres, juin 2025.

Nous présentons ici les résultats obtenus après une période de 6 mois de test. 

Title 5

  • FAIR Principles. (s. d.). GO FAIR. Consulté 3 juin 2025, à l’adresse https://www.go-fair.org/fair-principles/
  • Aubin, S., Corre, C., Jonquet, C., Cabrera-Bosquet, L., Rosati, I., NESTOLA, E., Ramezani, P., Tykhonov, V., Flohr, P., Scharnhorst, A., Christelle, P., Alviset, G., Szabo, D., Cecconi, B., pichot, christian, Clastre, P., Seinturier, J., & Caminha Juaçaba Neto, R. (2025). D4.6—Use case driven validation of semantic artefact exploitation within data repositories. https://zenodo.org/records/14917164
  • Kihal, B., Corre, C., Jonquet, C., Szabo, D., Roucou, J., & Aubin, S. (2024). Leveraging AgroPortal ontologies to ease metadata completion and data discovery in Data INRAE. https://zenodo.org/records/14191078
Retour en haut