Cette visualisation représente sous forme de graphe les corrélations entre vocabulaire et auteurs dans les fiches de lecture du dossier Analyse des richesses[1]. La cartographie a été réalisée pour être explorée de manière interactive avec le logiciel Gephi[2]. Elle peut aider à la découverte du contenu du corpus, et fournit des fonctionnalités d'exploration.
Figure 1 : Vue globale de la cartographie
Figure 2 : les termes associés à Locke | Figure 3 : les termes associés à Montesquieu | Figure 4 : les auteurs associés au terme "monnaie-signe" |
Les personnes sont représentées par des cercles (« nœuds ») orange, les termes de vocabulaire par des cercles gris ; lorsqu'un terme est utilisé par un auteur dans les fiches, un lien (« arête ») est tracé entre l'auteur (« source ») et le terme (« cible »).
La spatialisation (disposition des nœuds dans le plan) est générée automatiquement par le logiciel, selon les conditions suivantes :
Dans l'inventaire publié en ligne, le contenu des fiches a été indexé de manière « libre » : par exemple en regroupant les termes d'une distinction (ainsi l'opposition « prix naturel / prix courant » dans une fiche sur Adam Smith), ou en résumant certains passages au moyen des termes de la fiche (ainsi : « marque du prince : certifier le poids et le titre »). Cette indexation « libre » n'empêche pas, dans le site web, l'utilisation du moteur de recherche sur une partie des expressions composées : la recherche du terme « marque » renverra également la fiche contenant l'expression « marque du prince...». En revanche, pour l'utilité de la cartographie, il était nécessaire d'extraire certains termes des expressions composées, afin de les regrouper avec d'autres. Ce traitement a été réalisé de manière automatique, après une exclusion manuelle de certaines expressions (par exemple : conservation des syntagmes « prix naturel », « prix de marché », « marque du prince » ; extraction des termes « certifier », « poids », « titre »).
Autre traitement important, réalisé également de manière partiellement automatique : la lemmatisation des termes obtenus lors de l'étape ci-dessus. En effet, il semblait indispensable de regrouper les formes multiples d'un même terme en un seul lemme (faire passer les substantifs et adjectifs pluriels au singulier, les verbes conjugués, à l'infinitif...). Lorsque l'on souhaite retrouver dans l'inventaire les termes présents dans la carte, il faut donc garder en mémoire qu'ils peuvent apparaître sous d'autres formes. L'opérateur de troncature (l'astérisque : "*") du moteur de recherche est donc recommandé pour retrouver un maximum de formes lexicales.
[1] Seul le dossier Analyse des richesses a été cartographié pour l'instant.
[2] Pour plus d'informations sur l'utilisation des cartographies pour l'exploration des données de l'inventaire, voir la page Visualiser les données de l'inventaire. Pour obtenir de l'aide sur l'utilisation du logiciel, voir la page Utilisation du logiciel Gephi.
[3] Au total, le graphe compte 1151 nœuds (124 auteurs et 1027 termes) et 4152 arêtes (le dossier Analyse des richesses contient 174 fiches).
[4] Pas d'utilisation de « vocabulaires contrôlés » (thésaurus) pour décrire le contenu des fiches, de manière à respecter les choix des termes effectués par Foucault.