Thésaurus du GAHOM

CESCM
GAHOM

Principes généraux de l'indexation

Le Thésaurus des Images Médiévales en Ligne est un instrument permettant de constituer une base de données iconographique. Il a été conçu en privilégiant trois critères: simplicité, rapidité du travail d'indexation, efficacité pour l'utilisateur de la base de données. L'objectif de l'indexation est double: permettre une recherche aisée des images pertinentes ; donner une intelligence minimale de chaque image. Mais le premier de ces buts prime nettement sur le second, et la compréhension de l'image que propose la base de données ne peut avoir qu'un caractère limité. Il importe de souligner que l'indexation a pour but de produire un instrument de recherche documentaire; elle ne saurait être conçue comme une analyse de l'image, ni même comme une véritable description de celle-ci.

L'image médiévale est un document complexe, subtil, qui mêle souvent plusieurs niveaux de sens et de fonctionnement. L'indexation ne peut rendre compte de tous ces aspects, qui font pourtant la richesse d'une image. On aura intérêt à la concevoir comme une infra-description, qui s'en tient à une identification des composants principaux de l'image (personnages, éléments naturels et lieux, objets et éléments architecturaux), ainsi qu'à une approche, souvent partielle, des actions, états ou thèmes représentés; même le champ « Sujet » ne propose qu'un écho discursif minimal de l'image. C'est aux utilisateurs et aux chercheurs, et non aux concepteurs des bases de données, qu'il revient de produire les analyses que requièrent ces images.

Un nombre restreint de descripteurs

L'exigence de simplicité qui caractérise le TIMEL se traduit par une réduction forte du nombre des descripteurs retenus (1.300 environ, à l'exclusion des noms propres, des espèces végétales et animales, pour lesquels les listes restent ouvertes). On a, pour ce faire, privilégié des descripteurs de sens étendu, voire élargi par rapport à l'usage courant de la langue française. On a renoncé à des distinctions fines, mal adaptées au domaine des images médiévales et peu utiles pour l'utilisateur, auquel il vaut mieux proposer un ensemble de résultats ample, dans lequel il peut affiner lui-même sa sélection. Par exemple, une distinction entre « siège » et « trône », linguistiquement pertinente, s'avère sans pertinence ici. Aurait-il fallu les distinguer par leurs formes ou bien en fonction de la dignité du personnage assis? Dès lors qu'il n'y a pas de corrélation nette entre ces deux critères, aucune solution ne s'avère satisfaisante et le maintien de ces deux termes ne pourrait que conduire à des incohérences, sans même procurer d'avantage sérieux pour l'interrogation. Mieux vaut donc ne recourir qu'à un seul terme (en l'occurrence « siège ») et laisser l'utilisateur intéressé libre d'opérer sa propre typologie. Pour prendre un autre exemple, la même logique a conduit à ne retenir que le descripteur « rivière » et à exclure « fleuve ». En effet, il est impossible de distinguer, dans l'image, une rivière d'un fleuve. L'option retenue impose certes une entorse à l'usage linguistique courant, puisqu'elle conduit à qualifier de rivière le Nil ou les fleuves du Paradis; mais elle s'avère cependant moins problématique que le maintien d'une distinction inopérante, source de confusions et d'incohérences. Un thésaurus propose un usage conventionnel spécifique d'une langue; sa finalité l'autorise à sacrifier parfois l'élégance à l'efficacité.

Par ailleurs, toute multiplication de descripteurs, dans un champ lexical donné, produit des difficultés de délimitation. La possibilité de choisir entre plusieurs descripteurs proches et les variations d'usages qui en résultent sont l'un des facteurs principaux de lenteur du travail d'indexation. Elles alourdissent considérablement la phase de correction et peuvent conduire, lors de l'interrogation, à négliger des images pertinentes. L'un des objectifs du TIMEL est d'éviter ces difficultés et de proposer, grâce aux fiches thématiques qu'il contient, un ensemble de descripteurs dont les emplois soient aussi précis et délimités que possible.

Plus le nombre de descripteurs retenus est élevé, plus la maîtrise d'un thésaurus devient délicate et plus augmente la probabilité de variations dans son usage. A l'inverse, un thésaurus comportant un nombre réduit de descripteur est d'un maniement plus aisé, gage d'une indexation plus rapide et plus cohérente. La restriction du nombre de descripteurs a été menée de façon pragmatique, sans viser l'obtention d'un corpus homogène de termes, appartenant à un même niveau de généralité ou de spécificité. Ainsi, dans le cas d'un vocabulaire relativement précis, comme celui qui désigne les travaux agricoles, on a pu retenir une trentaine de termes (de « battage » à « semailles »), que l'utilisateur peut aussi appeler ensemble, grâce au terme générique « agriculture ». En revanche, l'effort de réduction a été particulièrement poussé dans les champs sémantiques où le vocabulaire est touffu, riche en synonymies et en intrications, et donc faiblement classificatoire. C'est le cas par exemple pour le vocabulaire du conflit et de la guerre où « combat » a été privilégié, au détriment de termes tels que bataille, dispute, bagarre, guerre, violence, etc., dont on serait bien en peine de définir des critères de différenciation applicables au domaine des images médiévales. De manière plus générale, les descripteurs du champ « Thèmes » ont fait l'objet d'une attention particulière, parce que c'est là que les risques de chevauchement entre les termes sont les plus grands et parce qu'il a fallu y limiter les termes abstraits, dont l'usage est particulièrement difficile à définir.

Un Thésaurus « généraliste »

Le TIMEL a été conçu pour l'indexation iconographique des productions figurées de l'Occident médiéval. Il prend en compte les aspects iconographiques, mais sans entrer dans le détail de certains domaines spécialisés. Il propose donc un « tronc commun », auquel un chercheur ou une équipe peut ajouter une (ou plusieurs) rubrique(s) correspondant à ses objectifs particuliers.

Bien qu'ils s'avèrent très importants pour l'analyse des images, certains aspects n'ont pas été pris en compte dans l'indexation, soit parce qu'ils auraient conduit à un alourdissement considérable de la base, pour un bénéfice parfois incertain, soit parce qu'ils posent des difficultés méthodologiques très complexes. Ce sont en particulier : - les éléments formels (couleurs, fonds ornementaux, etc.). En ce qui concerne le décor secondaire, on se limite à une typologie très rudimentaire, qui ne constitue nullement une véritable indexation des motifs ornementaux. Un thésaurus ornemental serait un complément judicieux du présent outil. - les gestes et les positions. Seuls certains gestes fondamentaux et bien identifiables sont notés (« prière », par exemple). On considère qu'une indexation descriptive (type « debout », « de face », « main levée », etc.) aurait été très lourde pour un bénéfice limité, tandis qu'une indexation fondée sur la signification des gestes soulève des problèmes d'interprétation très délicats. - les vêtements: on considère qu'il s'agit d'un domaine spécialisé, dont la prise en compte aurait alourdi considérablement la base (le descripteur « vêtement » n'est utilisé que lorsque celui-ci est représenté pour lui-même ou comme objet de l'action).

Restent à évoquer quelques points de méthode déterminants dans la pratique de l'indexation.

Logique de l'interrogation vs. logique de la description

Compte tenu de l'objectif assigné à l'indexation, on fait toujours primer la logique de l'interrogation, c'est-à-dire la pertinence du résultat pour l'utilisateur de la base. On doit d'autant plus garder ce principe à l'esprit au cours du travail d'indexation qu'on est alors aisément tenté d'entrer dans le détail de l'image, voire de livrer l'analyse que l'on a commencé d'élaborer. Il est alors nécessaire de se rappeler que cette image est une, parmi des dizaines de milliers. Le Thésaurus joue ici un rôle important : avec sa froide logique de règlement, il rappelle l'indexeur à l'ordre et fait valoir que la constitution d'une base de données de grande ampleur impose de se placer à une échelle différente. Par ailleurs, le primat accordé à la logique de l'interrogation conduit à éliminer des descripteurs faiblement discriminants et donc peu pertinents lors de l'interrogation. Ainsi, une logique de la description pourrait conduire à indiquer la présence d'un personnage non identifié par le terme « homme » ou « femme ». Ces termes ont cependant été exclus en raison de leur intérêt très faible pour l'interrogation.

Indexation de l'image ou indexation du texte ?

Il est fréquent qu'une image – et notamment une miniature – ne soit intelligible que dans la mesure où l'on connaît le texte qu'elle illustre. L'image renvoie à un contenu narratif ou discursif qu'elle ne représente bien souvent que très partiellement. L'indexation doit-elle alors porter sur ce que l'on voit dans l'image ou sur ce que l'on sait de sa signification, grâce au détour du texte ? Aucune de ces deux réponses extrêmes ne serait pertinente. Il faut donc tenter une voie médiane, nécessairement plus délicate à tracer : ni trop de naïveté visuelle (qui laisserait l'image inintelligible), ni trop de référence au texte (qui étoufferait l'image).

Un moyen pour atténuer cette difficulté joue de la dualité entre le champ « Sujet » et les descripteurs des autres champs. En effet, tandis que l'usage des descripteurs doit rester lié au contenu effectivement représenté dans l'image, le champ « Sujet » permet, dans une certaine mesure, d'intégrer quelques informations textuelles que l'image ne montre pas véritablement mais qui la rendent intelligible. Ainsi, en tête du Livre des Nombres,Yahvé ordonne le recensement des hébreux; mais l'image se contente de montrer une apparition de Yahvé à Moïse, sans préciser d'aucune manière le contenu du message divin. Il n'y a donc pas lieu de recourir au descripteur « dénombrement » (en « Thèmes »), dès lors que cette action n'est pas représentée. En revanche, l'indication dans le champ « Sujet » de « Dieu ordonnant à Moïse de recenser les hébreux » permet d'apporter cette utile précision.

Un usage systématique des descripteurs

Dès lors qu'un descripteur existe dans le Thésaurus, la présence de l'élément correspondant dans une image doit être systématiquement indiquée. On exclut tout jugement sur l'intérêt ou non de la représentation (même si elle est détériorée ou peu visible). En ne notant que ce qu'on jugerait remarquable, on tendrait à se substituer au chercheur et on ruinerait la fiabilité du résultat proposé. De même, on doit indiquer systématiquement les personnages figurant dans l'image, même si leur présence est impliquée par l'usage d'autres descripteurs (par exemple, la Vierge dans l'Annonciation). N.B. : Quelques termes font l'objet d'un emploi non systématique (mais non pas fondé sur un jugement d'intérêt). Par exemple, « selle » n'est utilisé que si l'objet est figuré isolément (les autres seront repérées par l'intermédiaire de « chevauchée », « cheval », « âne »...). On procède également ainsi pour certains termes d'architecture, comme « colonne » ou « fenêtre ». De même, un descripteur comme « lit » rend inutile de préciser la présence d'un coussin et de draps.

Télécharger le document complet en pdf

Ce programme est cofinancé par l’Union européenne.
L’Europe s’engage en Poitou-Charentes avec le Fonds européen de développement régional.