Introduction aux ontologies
Une ontologie est une représentation de la connaissance sur un domaine. C’est une vision d’une partie du monde, une abstraction suffisamment générique pour couvrir de multiples situations mais également suffisamment indépendante d’une situation donnée.
Les ontologies vont permettre de :
- disposer d’un vocabulaire partagé par les humains et les machines
- typer et structurer les données
- réaliser des inférences ou raisonnements logiques
Sommaire
Principes théoriques
Qu’est-ce qu’une ontologie ?
Les ontologies sont une des composantes du Web Sémantique et soutiennent l’hypothèse d’un monde ouvert (« Open-world assumption »). Cette hypothèse stipule que ce qui n’est pas connu pour être vrai n’est pas nécessairement faux, mais peut simplement être trouvé ailleurs sur le web, de par sa nature distribuée. En pratique, cela signifie que les conclusions ne peuvent être tirées qu’à partir d’axiomes explicitement énoncés. Cela constitue une différence fondamentale avec les modèles de données classiques qui se positionnent dans un monde fermé relativement restreint où l’ensemble des données doit être typé spécifiquement par rapport à une application donnée.
Selon la définition bien connue dans la littérature sur l’intelligence artificielle, une ontologie est une spécification formelle et explicite d’une conceptualisation partagée d’un domaine [1-5].
- La spécification est la traduction du modèle dans un langage formel. Elle est formelle et explicite parce qu’elle est structurée et qu’elle relie les concepts avec des propriétés, des contraintes et des règles.
- La conceptualisation est liée à la perception réelle d’un domaine par un groupe de personnes expertes dans ce domaine. Elle est partagée parce qu’elle est intersubjective et doit être développée main dans la main avec toutes les parties prenantes pour être cohérente et inclusive.
Les classes sont les principaux éléments constitutifs d’une ontologie et sont utilisées pour représenter et décrire les concepts d’un domaine. Elles sont organisées hiérarchiquement, de sorte que chaque classe peut avoir des superclasses et des sous-classes (généralisation/spécialisation) permettant ainsi l’héritage de propriétés. Les classes sont également reliées entre elles par d’autres types de relations spécifiques.
L’ontologie permet de définir le contexte sous la forme de contraintes et de règles au sujet des états possibles des « affaires » ou « états du monde » qui existent dans un domaine, et qui nous aident à comprendre ce que sont exactement ces concepts et de quelle manière ils peuvent être liés les uns aux autres.
La représentation symbolique est une manière de modéliser la connaissance en utilisant des concepts et les symboles tels que les mots représentant le langage naturel. Les connaissances sont alors formulées explicitement à l’aide d’éléments élémentaires, souvent appelés « énoncés » ou « propositions ».
On appelle « engagement ontologique » le consensus établi pour utiliser le vocabulaire partagé de manière cohérente et consistante dans un contexte précis.
Il existe des outils OWL – des raisonneurs – qui peuvent calculer automatiquement les conséquences logiques appelées « inférences ».
Exemple de présentation
On fait souvent l’amalgame entre l’ontologie (le schéma ou modèle) et les instances (les individus qui peuplent l’ontologie). Les données une fois typées à l’aide de l’ontologie et assemblées sous forme de graphes RDF constituent une base de connaissances (Knowledge base).
La figure ci-dessous présente un exemple de petite ontologie ainsi que des valeurs de données (instances) décrites à l’aide de l’ontologie.

Dans cet exemple, les rectangles bleus représentent les classes de l’ontologie (par exemple, Objet physique, Acteur, Personne), les rectangles verts sont des instances (par exemple, Yannis, EFSA, 85 Kg), les flèches doubles représentent les hiérarchies de classes et sous-classes (isA) (par exemple, Person isA Physical Object ou Organization isA Actor), les flèches simples représentent les propriétés (par exemple, has_weight) et les flèches en pointillés représentent les relations d’instances. Les relations isA permettent d’exprimer des informations bien qu’elles ne soient pas explicitement définies, comme le fait qu’une personne a un poids (Yannis a un poids de 85 kg), déduit du fait que la classe Personne est une sous-classe de la classe Objet physique. De même, une organisation a une adresse postale (l’EFSA a pour adresse « Via Carlo Magno 1A 43126 Parma – Italy »), ce qui est déduit du fait que la classe Organisation est une sous-classe de la classe Acteur.
Définition formelle et définitions textuelles
Les classes, propriétés et contraintes constituent la définition formelle de l’ontologie (axiomatisation). Cette définition formelle destinée aux machines est complétée par des définition textuelles compréhensibles par les humains.
Les définitions, qu’elles soient textuelles ou formelles, sont une représentation d’un concept par une description, un énoncé de sa signification qui le distingue d’autres concepts similaires [6]. Elles peuvent être de deux types :
- intentionnelles : elles spécifient une condition logique qui fera la différence entre objets qui la satisfont et par conséquent appartiendront à la classe et ceux qui ne la vérifient pas.
- extensionnelles : elles listent explicitement tous les éléments qui correspondent à la définition
En pratique, les définitions formelles sont décrites en OWL, le Web Ontology Language et en particulier la version OWL2 établie en 2012 par le W3C. Il existe néanmoins différents langages ontologiques, tous basés sur un type de formalisme logique. Le langage OWL 2, construit autour de RDF mais bien plus expressif, supporte, dans sa variante DL, une fonctionnalité appelée « punning », du mot anglais pun, calembour) qui permet qu’une entité peut être interprétée soit comme une classe soit comme un individu en fonction du contexte syntaxique (on parle alors de métaclasse).
Par ailleurs, SKOS ou Simple Knowledge Organization System est une recommandation du W3C qui permet de représenter en RDF les définitions textuelles et de gérer efficacement les notions liées à la langue.
En résumé, les ontologies peuvent jouer le rôle de langage commun entre les experts du domaine et les développeurs informatiques. L’ontologie fournit la sémantique définissant les objets, un champ d’application et une description claire du système, qui sont autant d’éléments essentiels pour être manipulables par les machines (« machine-actionable »).
Néanmoins, pour qu’elles soient compréhensibles par les experts du domaine, il est nécessaire de documenter les classes et les propriétés avec des définitions textuelles et de les désigner par des termes précis, et si pertinent, avec des synonymes en plusieurs langues. Cette documentation peut prendre la forme d’une terminologie ou d’un thésaurus au format SKOS.
Les ontologies en pratique
Notions utilisées en sciences computationnelles
Les ontologies intègrent des informations sur les classes, les propriétés et les individus, dont chacun peut avoir un identifiant qui est une référence URI. Certaines de ces propriétés doivent être assorties d’axiomes.
Différents termes sont utilisés pour désigner les éléments qui constituent les schémas conceptuels et les modèles ontologiques informatiques. Des synonymes sont indiqués entre parenthèses dans la liste ci-dessous :
- Classe (type d’entité ou d’objet, owl:Class) : catégorie d’éléments ayant des caractéristiques ou propriétés communes et qui peuvent être sujet ou objet des relations ou prédicats.
- Sous-classe (sous-concept, sous-type défini par la relation rdfs:subClassOf) : une sous-classe est une classe plus spécifique qui hérite des propriétés de la classe parente (une sous-classe Y hérite des propriétés de la classe X si Y est un type de X).
- Instances (données, objets, individus définis par la relation rdf:type) : Ce sont les réalisations concrètes ou objets typés par les classes, qui elles sont abstraites. Les instances d’une classe répondent aux critères qui définissent cette classe.
- Relations (prédicats ou ‘slots’, owl:ObjectProperty) : Elles définissent la manière dont les classes peuvent être reliées les unes aux autres sur la base de leurs instances. Les relations typiques sont has, partOf, instanceOf, performedBy, etc.
- Propriétés (rôles, caractéristiques, attributs, owl:DataProperty). Elles correspondent à des relations pointant vers une valeur textuelle ou numérique appelée « littéral ». Elles permettent d’inclure des déclarations sur les types de données. Par exemple, l’individu Yannis a un poids de 85 kg ou l’EFSA a pour adresse « Via Carlo Magno 1A 43126 Parma – Italy ».
- Facettes (fonctionnalités, propriétés des objets, owl:Restriction) : elles définissent quelles sont les valeurs autorisées d’une propriété, cardinalité, les caractéristiques ou paramètres que les objets peuvent posséder ou partager (domaine et portée). Une restriction décrit une classe d’individus sur la base des relations auxquelles les membres de la classe participent. En d’autres termes, une restriction est une sorte de classe, de la même manière qu’une classe nommée est une sorte de classe.
- Axiomes : assertions ou règles qui permettent d’exprimer les relations qui sont toujours vraies entre les classes ou les instances de classes. Ce sont des énoncés exprimés dans un langage formel comme la logique de description. Ils sont admis sans démonstration et explicitent la conceptualisation. Par exemple, l’axiome de disjonction de deux classes stipule qu’aucune instance d’une classe ne peut être également une instance de l’autre classe, et donc que les classes s’excluent mutuellement. Ainsi une instance de la classe Herbivore ne peut pas être une instance de la classe Carnivore.
En résumé, les classes sont les principaux éléments constitutifs d’une ontologie et sont utilisées pour représenter et décrire les concepts d’un domaine. L’épine dorsale d’une ontologie consiste en une hiérarchie de concepts de généralisation/spécialisation (taxonomie).
Les relations entre les classes jouent un rôle analogue à celui d’un verbe grammatical, en ce sens qu’elles permettent de créer les triplets sujet-prédicat-objet qui constituent la base de RDF. Elles doivent être définies en référence à leur domaine (domain) et à leur étendue (range), qui sont analogues au sujet et à l’objet en grammaire. D’autres restrictions ou contraintes logiques peuvent s’appliquer pour définir la sémantique et permettre d’appliquer le raisonnement (inférences).
L’outil le plus utilisé pour construire ou visualiser une ontologie est le logiciel Protégé.
Les différents types d’ontologies
Il existe différents niveaux d’ontologie, selon leur degré de formalisme, d’abstraction (généralisation ou spécialisation) ou les objectifs qu’elles poursuivent [7].
Une ontologie de premier niveau ou fondationnelle (top level) est une ontologie qui définit les catégories les plus générales, au sommet de la hiérarchie, qui peuvent être partagées par différents domaines. Comme il n’est pas si facile de produire et d’approuver des ontologies fondationnelles de façon unanime, plusieurs ontologies de haut niveau ont été produites au fil du temps.
On peut citer par exemple BFO (Basic Formal Ontology), DOLCE (Descriptive Ontology for Linguistic and Cognitive Engineering), ou encore UFO (Unified Foundational Ontology).
Les ontologies de niveau supérieur sont agnostiques (indépendantes d’un domaine particulier). Elles servent principalement à assurer l’interopérabilité sémantique des ontologies entre plusieurs domaines. Elles servent de référence pour le raisonnement et s’attachent généralement à définir les mêmes types d’entités génériques appelées « universals » en anglais [8] :
- entités abstraites et entités matérielles
- entité indépendante (substance) et entité dépendante (qualité, caractéristique)
- continuant (ou endurant) et occurrent (ou perdurant)
- temps et espace
Les ontologies de niveau intermédiaire (middle level) sont souvent des ontologies de référence qu’on qualifie aussi de « core ontologies » ou « utilities ontologies ». La plupart du temps, les ontologies de niveau intermédiaire étendent une ontologie de niveau supérieur dans une perspective modulaire [9]. Par exemple, les ontologies Information Artifact Ontology (IAO) et Ontology for Biomedical Investigations (OBI) viennent compléter BFO avec des entités décrivant les informations (données, publications, codes, logiciels…) et des processus planifiés (planned process) venant spécialiser les entités définies comme continuants ou occurents au niveau fondationnel [10-11]. A ce niveau, on trouve aussi des patrons de conception d’ontologie (Ontology Design Patterns ou ODP), une solution proposée pour faciliter le développement d’ontologies et aider les utilisateurs à éviter certaines des erreurs de modélisation les plus fréquentes. Les ODP trouvent leur origine dans des approches similaires en génie logiciel, où les modèles de conception logicielle sont devenus un aspect essentiel du développement logiciel [12].
Viennent ensuite les ontologies de plus bas niveau qui sont spécifiques à un domaine ou à un type d’application ou de tâche. Ces ontologies rassemblent des connaissances opérationnelles, c’est-à-dire des concepts pertinents pour un domaine spécifique ou une activité donnée. Ces ontologies sont souvent créées en réutilisant des concepts existants (ce qui est la pratique recommandée) mais elles peuvent aussi parfois être construites à façon pour répondre à des besoins spécifiques.
En termes d’expressivité, les ontologies peuvent être classées en deux catégories : lourdes et légères. Les ontologies lourdes comprennent tous les éléments nécessaires (tels qu’une axiomatisation riche) pour qu’il soit possible de faire des déductions sur les connaissances qu’elles contiennent. En revanche, les ontologies légères manquent d’axiomes et d’autres contraintes, et il est donc très difficile de raisonner dessus mais elles offrent plus de souplesse [13].
L’approche recommandée par le W3C pour construire une ontologie consiste à réutiliser au maximum les concepts en étendant les classes existantes au lieu de les modifier, en ajoutant des sous-classes et en associant de nouvelles propriétés. Cette méthode permet de préserver l’intégrité des modèles tout en offrant des adaptations spécifiques.
Des méthodes d’aide à la conception d’ontologie comme Linked Open Terms (LOT) sont à utiliser.
Quelques ontologies de référence
Des efforts considérables de normalisation des ontologies et des langages du web sémantique ont été réalisés au cours de la dernière décennie et témoignent également de la maturation du domaine.
Plusieurs ontologies et vocabulaires sont devenus des recommandations du World Wide Web Consortium (W3C), l’organisme de normalisation du web :
- L’ontologie du temps (OWL-Time), qui décrit les propriétés temporelles des ressources.
- L’ontologie du réseaux des capteurs SSN et sa version allégée Sensor, Observation, Sample, and Actuator (SOSA) pour représenter les observations [14].
- L’ontologie de provenance (PROV-O), qui décrit les informations provenant de différents systèmes.
- Le cube de données (RDF Data Cube Vocabulary), qui permet la publication de données multidimensionnelles sur le web.
On peut aussi citer des ontologies produites par les communautés de pratique comme par exemple The data analysis and management ontology (EDAM) ou Just Enough Results Model (JERM) utilisées en bioinformatique, ou encore GeoNames Ontology pour les informations géospatiales. Plusieurs ontologies ont également été proposées pour définir les unité de mesure, comme Quantities Units Dimensions and Types (QUDT).
Pour que les ontologies soient utilisées dans la pratique, elles doivent être stockées dans des entrepôts ouverts et, si nécessaire, faire l’objet d’une validation par un raisonneur.
Pour trouver des ontologies, on peut consulter des entrepôts et catalogues dédiés.
Il existe des communautés très actives dans certains domaines, comme par exemple le consortium OBO Foundry (Open Biological and Biomedical Ontology Foundry) qui rassemble plus d’une centaine d’ontologies ayant trait aux sciences du vivant, qui ont adopté des principes communs.
Dans le domaine de l’agriculture, l’alimentation et l’environnement, la plupart des ressources sémantiques produites à INRAE sont hébergées sur AgroPortal.
- [1] Gruber, T.R. (1993). A translation approach to portable ontology specifications, Knowledge Acquisition, Volume 5, Issue 2, Pages 199-220. https://doi.org/10.1006/knac.1993.1008
- [2] Borst, W. (1997). Construction of Engineering Ontologies. PhD thesis, Institute for Telematica and Information Technology, University of Twente, Enschede, The Netherlands.
- [3] Studer, R., Benjamins, V.R., Fensel, D. (1998). Knowledge Engineering: Principles and Methods. Data & Knowledge Engineering, 25, 161-198. https://doi.org/10.1016/S0169-023X(97)00056-6
- [4] Noy, N.F. and McGuinness, D. L. (2001). Ontology Development 101: A Guide to Creating Your First Ontology, Knowledge Systems Laboratory, vol 32. http://protege.stanford.edu/publications/ontology_development/ontology101.pdf
- [5] Guarino, N., Oberle, D., Staab, S., Studer, R. (2009). What is an ontology in : Handbook on ontologies, Springer. https://doi.org/10.1007/978-3-540-92673-3_0
- [6] Vezina, R. (2009). La rédaction de définitions terminologiques. https: //www.oqlf.gouv.qc.ca/pdf/redaction_def_terminologiques_2009.pdf
- [7] Obrst, L.(2010). Ontological Architectures. In: Poli, R., Healy, M., Kameas, A. (eds), Theory and Applications of Ontology: Computer Applications. Springer, Dordrecht. https://doi.org/10.1007/978-90-481-8847-5_2
- [8] Jansen, L. (2008), Top-level ontologies, in: Munn, K. and Smith, B. (eds), Applied ontology, an introduction, Volume 9 in the series Metaphysics Research, Walter de Gruyter GmbH, Berlin. https://doi.org/10.1515/9783110324860.173
- [9] Beverley, J., Colle, G. D., Jensen, M., Benson, C., & Smith, B. (2024). Middle Architecture Criteria, arXiv 2404.17757, https://doi.org/10.48550/arXiv.2404.17757
- [10] Ceusters W. (2012). An information artifact ontology perspective on data collections and associated representational artifacts. Studies in health technology and informatics, 180, 68–72. https://doi.org/10.3233/978-1-61499-101-4-68
- [11] Bandrowski, A., Brinkman, R., Brochhausen, M., Brush, M. H., Bug, B., Chibucos, M. C., Clancy, K., Courtot, M., Derom, D., Dumontier, M., Fan, L., Fostel, J., Fragoso, G., Gibson, F., Gonzalez-Beltran, A., Haendel, M. A., He, Y., Heiskanen, M., Hernandez-Boussard, T., Jensen, M., … Zheng, J. (2016). The Ontology for Biomedical Investigations. PloS one, 11(4), e0154556. https://doi.org/10.1371/journal.pone.0154556
- [12] Keets C.M. (2020). An introduction to ontology engineering, v1.5. https://people.cs.uct.ac.za/~mkeet/OEbook/
- [13] Nguyen V. (2011). Ontologies and Information Systems: a Literature Survey, Defence Science and Technology Organisation Edinburgh, Australia. https://apps.dtic.mil/sti/tr/pdf/ADA546186.pdf
- [14] Janowicz, K., Haller, A., Cox, S.J.D., Le Phuoc, D., Lefrançois, M. (2019). SOSA: A lightweight ontology for sensors, observations, samples, and actuators. Journal of Web Semantics, 56, 1-10. https://doi.org/10.1016/j.websem.2018.06.003
- Grimm S., Abecker A., Völker J. , Studer R. (2011). Ontologies and the semantic web, in: Handbook of Semantic Web Technologies, Springer, pp. 507–579. https://doi.org/10.1007/978-3-540-92913-0
- Guizzardi G, Botti Benevides A, Fonseca CM, Porello D, Almeida JPA, Prince Sales T. UFO: Unified Foundational Ontology. Applied Ontology. 2022;17(1):167-210. doi:10.3233/AO-210256
- Jensen, M., De Colle, G., Kindya, S., More, C., Cox, A.P., Beverley, J. (2024). The Common Core Ontologies, in: Frontiers in Artificial Science and Applications, vol 394, Proceedings of the 14th International Conference (FOIS 2024). https://doi.org/10.3233/FAIA241292
- Munn K., and Smith B. (2008). Applied Ontology: An Introduction, Berlin, Boston: De Gruyter. https://doi.org/10.1515/9783110324860
- Otte JN, Beverley J, Ruttenberg A. BFO: Basic Formal Ontology. Applied Ontology. 2022;17(1):17-43. doi:10.3233/AO-220262
- Roussey C., Pinet F., Kang O. , Corcho M.A. (2011). An introduction to ontologies and ontology engineering, in: Ontologies in Urban Development Projects, Springer. https://link.springer.com/chapter/10.1007/978-0-85729-724-2_2
- Smith B., Basic Formal Ontology (BFO 2020), consulté le 10/05/2025, https://youtu.be/uflMfvI-ZxI?si=qiX0x6TWgN5r2ndF et https://youtu.be/GWkk5AfRCpM?si=w6LJSGo7yattA6ky
- Tudorache, T. (2020). Ontology engineering: Current state, challenges, and future directions. Semantic Web. 11(1):125-138. https://doi.org/10.3233/SW-190382
- Tzitzikas Y., Marketakis Y., Mountantonakis M., Fafalios P., Theodoridou M., Axaridou A., Kritsotaki A., and Bekiari C. (2024). Architectural Suggestions for Ontology Management. EFSA supporting publication 21(12):EN-9118. https://doi.org/10.2903/sp.efsa.2024.EN-9118
- Tzitzikas Y., Marketakis Y., Fafalios P., Kritsotaki A., Axaridou A., Mountantonakis M., Bekiari C., and Theodoridou M. (2024). Governance Model for Ontologies. EFSA supporting publication 21(12):EN-9119. https://doi.org/10.2903/sp.efsa.2024.EN-9119
- Tzitzikas Y., Fafalios P., Kritsotaki A., Axaridou A., Marketakis Y., Mountantonakis M., Bekiari C., and Theodoridou M. (2024). Ontologies and Case Studies. EFSA supporting publication 21(12):EN-9120. https://doi.org/10.2903/sp.efsa.2024.EN-9120
INRAE (2025), Introduction aux ontologies, Vocabulaires Ouverts@INRAE, https://istblogs.d-marheine.com/lovinra/focus-sur-les-ontologies/
Magalie Weber
Sophie Aubin, Anne-Sophie Bage
Date de création : 29/08/2025 – Dernière Mise à jour :14/11/2025
