Cartographie des relations entre personnes et terminologie

Principes de la cartographie

Cette visualisation représente sous forme de graphe les corrélations entre vocabulaire et auteurs dans les fiches de lecture du dossier Analyse des richesses[1]. La cartographie a été réalisée pour être explorée de manière interactive avec le logiciel Gephi[2]. Elle peut aider à la découverte du contenu du corpus, et fournit des fonctionnalités d'exploration.

  • Découverte : la cartographie aide à prendre connaissance rapidement des termes les plus fréquents, et à voir les auteurs associés. Elle donne une vue synoptique du contenu, ce qui n'est pas possible avec les outils du portail web de l'inventaire.
  • Figure 1 : Vue globale de la cartographie

  • Exploration : le graphe permet de visualiser rapidement les termes associés plus ou moins directement à un auteur dans les fiches ou inversement, les auteurs coprésents à un terme figurant dans les fiches; il est également possible de réaliser des recherches de proximité (voisins de voisins). Étant donnée la complexité du graphe[3], les fonctions du logiciel qui permettent d'en sélectionner seulement une partie sont indispensables (sur ces fonctions, voir la page d'aide).

Figure 2 : les termes associés à Locke Figure 3 : les termes associés à Montesquieu Figure 4 : les auteurs associés au terme "monnaie-signe"

Les personnes sont représentées par des cercles (« nœuds ») orange, les termes de vocabulaire par des cercles gris ; lorsqu'un terme est utilisé par un auteur dans les fiches, un lien (« arête ») est tracé entre l'auteur (« source ») et le terme (« cible »).

La spatialisation (disposition des nœuds dans le plan) est générée automatiquement par le logiciel, selon les conditions suivantes :

  • Les termes les plus utilisés apparaissent au centre
  • La taille des nœuds (cercles) représentant les termes est fonction du nombre d'auteurs qui les utilisent
  • La taille des noms d'auteurs est fonction du nombre de termes qu'ils utilisent (une seule taille pour les cercles)

Remarques sur le traitement du vocabulaire

Dans l'inventaire publié en ligne, le contenu des fiches a été indexé de manière « libre » : par exemple en regroupant les termes d'une distinction (ainsi l'opposition « prix naturel / prix courant » dans une fiche sur Adam Smith), ou en résumant certains passages au moyen des termes de la fiche (ainsi : « marque du prince : certifier le poids et le titre »). Cette indexation « libre » n'empêche pas, dans le site web, l'utilisation du moteur de recherche sur une partie des expressions composées : la recherche du terme « marque » renverra également la fiche contenant l'expression « marque du prince...». En revanche, pour l'utilité de la cartographie, il était nécessaire d'extraire certains termes des expressions composées, afin de les regrouper avec d'autres. Ce traitement a été réalisé de manière automatique, après une exclusion manuelle de certaines expressions (par exemple : conservation des syntagmes « prix naturel », « prix de marché », « marque du prince » ; extraction des termes « certifier », « poids », « titre »).

Autre traitement important, réalisé également de manière partiellement automatique : la lemmatisation des termes obtenus lors de l'étape ci-dessus. En effet, il semblait indispensable de regrouper les formes multiples d'un même terme en un seul lemme (faire passer les substantifs et adjectifs pluriels au singulier, les verbes conjugués, à l'infinitif...). Lorsque l'on souhaite retrouver dans l'inventaire les termes présents dans la carte, il faut donc garder en mémoire qu'ils peuvent apparaître sous d'autres formes. L'opérateur de troncature (l'astérisque : "*") du moteur de recherche est donc recommandé pour retrouver un maximum de formes lexicales.

Fichiers du graphe

  • Télécharger le fichier "projet Gephi" avec mise en forme : LBF_carto_ref_biblio.gephi. Ce fichier est celui dont sont tirées les captures d'écran : les noeuds ont été redimensionnés, colorés, et répartis selon l'ordre des cinq dossiers.
  • Télécharger le fichier Gephi brut : LBF_carto_ref_biblio.gexf. Ce fichier au format gexf est le résultat de traitements effectués sur les données de l'inventaire XML-EAD (lemmatisation et requêtes XQuery : cf. ci-dessus, Remarques sur le traitement du vocabulaire); c'est à partir de ce fichier gexf que l'on peut produire des spatialisations comme celle qui est proposée ci-dessus, dans le fichier "projet Gephi".

Notes

[1] Seul le dossier Analyse des richesses a été cartographié pour l'instant.

[2] Pour plus d'informations sur l'utilisation des cartographies pour l'exploration des données de l'inventaire, voir la page Visualiser les données de l'inventaire. Pour obtenir de l'aide sur l'utilisation du logiciel, voir la page Utilisation du logiciel Gephi.

[3] Au total, le graphe compte 1151 nœuds (124 auteurs et 1027 termes) et 4152 arêtes (le dossier Analyse des richesses contient 174 fiches).

[4] Pas d'utilisation de « vocabulaires contrôlés » (thésaurus) pour décrire le contenu des fiches, de manière à respecter les choix des termes effectués par Foucault.

Des infos | © 2007-2010 | Fait avec Logo Pleade