Voici une action de dissémination de contenus facile, rapide à mettre en oeuvre, et plutôt satisfaisante en terme de résultats (et de statistiques). L'opération "Signatures"1 vise à numériser et diffuser sur les plateformes Wiki des signatures de personnes plus ou moins VIP croisées dans les fonds d'archives et autres documents patrimoniaux.

Seul·e ou en équipe, le processus est le suivant :

  • repérage d'une signature ne figurant pas sur l'article Wikipédia ou l'élément Wikidata d'une personne ;
  • numérisation (un appareil photo de téléphone fait très bien l'affaire), sans oublier de bien les métadonnées basiques (nom de l'individu, date et cote du document) ;
  • nettoyage rapide de l'image et passage en noir et blanc (ou niveaux de gris) ;
  • mise en ligne de l'image sur Wikimédia Commons, en pensant à la catégoriser (avec, pourquoi pas, une catégorie dédiée, afin de les recenser et d'avoir des statistiques complètes) ;
  • rattachement de la signature à l'élément Wikidata de la personne ;
  • dissémination automatique sur les Wikipédia.

Et c'est ainsi que la signature de Jean Moulin s'est retrouvée, en moins de 5 minutes, correctement positionnée dans les infobox des Wikipédia en gaélique et en grec.

 

39 operation signatures jeanmoulin

 

Signature des graveurs Gaspard et Gérard Edelinck - Archives nationales (France)

La signature permet d'illustrer la notice d'un individu lorsqu'il n'y a pas de portrait. Pour les signatures de personnes célèbres, c'est très efficace pour obtenir de grosses statistiques de consultation d'image. Cela peut sembler parfois un peu gadget... Mais les signatures sont fréquemment utilisées par les chercheurs pour identifier ou différencier des individus. On peut ainsi identifier correctement les autographes des deux frères Gaspard et Gérard Edelinck, graveurs, là où on pourrait se tromper sur l'initiale du prénom.

 

Côté retouche d'image, des outils simples comme Paint et XnView suffisent amplement :

  • XnView permet de jouer facilement sur les contrastes et la luminosité de l'image, avant de la passer en noir et blanc ou en niveaux de gris.
  • L'outil Gomme de Paint et la sélection de zone est pratique pour éliminer les tâches de pixels qui subsistent après le passage en noir et blanc.
  • De simples copier / coller permettent de jongler entre l'un et l'autre des logiciels.

 

39 operation signatures nettoyage xnview

 

39 operation signatures nettoyage paint

Une fois l'image importée sur Wikimédia Commons (voir le tutoriel), il faut ajouter l'image sur l'élément Wikidata de l'individu, en utilisant la propriété Signature (P109).

 

39 operation signature wikidata

39 operation signature infobox

 

Puis il suffit de laisser la signature vivre sa vie sur les wiki et se disséminer (presque) toute seule... La signature va apparaître dans les infobox Wikipédia alimentées par Wikidata. Les différentes réutilisations figurent tout en bas de la page Commons de la signature (exemple de celle de Charles Mangin).

Si la signature n'apparaît pas automatiquement sur la Wikipédia en français, c'est parce que l'infobox n'est pas alimentée par Wikipédia. Il faut donc ajouter le nom de fichier en modifiant le wikicode (sous réserve que le modèle d'infobox intègre par défaut la signature).

 

39 operation signature wikicode

 

Pour terminer, citons deux outils complémentaires indispensables :

  • GLAMorous : statistiques d'utilisation et de visualisation sur les Wikipédia des images d'une catégorie Commons (exemple)
  • CropTool : outil pour rogner une image de Commons et créer une nouvelle image (au hasard : une signature au bas d'un document)

 

Passer au mode industriel avec OpenRefine (mise à jour avril 2023)

A partir de la version 3.7, un plug-in Commons permet d'importer des images ET leurs métadonnées depuis OpenRefine. Pour les signatures par exemple, une fois les images détourées et stockées dans un même répertoire, il est possible de paramétrer les contenus à associer aux images : wikitext de la description (ici modèle "Informations" avec catégories, licences, lien vers l'image source dont la signature est détourées ; données structurées de l'image).

Mon tableau de données des signatures à importer contient notamment les colonnes suivantes :

  • "individu" réconciliée avec Wikidata,
  • catégorie Commons (parfois existante sur Commons, ou à créer)
  • "desc" : colonne de travail qui permet de forger en masse la description en français de l'image (texte récurrent + contenu de la colonne "individu" + texte récurrent)
  • wikitexte : basée sur le modèle "Information" de Commons, elle contient la description, l'auteur, la source, la date, l'image d'origine et les catégories
  • filename : nom du fichier tel qu'il apparaîtra sur Commons (Signature + cells["individu"].value + ".jpg")
  • legende : légende de la signature (faite à partir de la colonne "filename", en enlevant .jpg et en rajoutant (1790) )
  • file : nom du fichier de l'image détourée sur mon disque dur
  • path : chemin de l'image détourée sur mon disque dur

39 openrefine signature1

 

Je travaille ici sur plusieurs centaines de signatures à importer sur le même modèle (même si je fais de petits lots d'une dizaine d'images détourées par département) : autant dire que j'ai vite fait de mettre en favori dans OpenRefine les formules de création du wikitext ou encore du chemin d'accès de l'image.

 

39 openrefine signature3

 

Il s'agit ensuite de lancer une réconciliation Commons sur la colonne filename, afin de vérifier qu'aucun fichier ne porte le même nom en ligne, puis de valider la création et imports des nouveaux fichiers. Url de l'API à renseigner lors de la première réconciliation : https://commonsreconcile.toolforge.org/en/api

Dans l'onglet Schéma, il s'agit ensuite de paramétrer le schéma d'import Commons (en sélectionnant l'instance Wikibase Wikimédia Commons en destination). Les champs "file path", "file name" et "wikitext" sont obligatoires. Ce qu'on paramètre dans "déclarations" correspond aux données structurées de Wikidata qui décrivent désormais les images sur Commons (facultatif, mais tellement pratique de les renseigner désormais en masse).

39 openrefine signature2

Nouveauté de la version 3.7 d'OpenRefine : on peut mémoriser des schémas de données (Commons, Wikidata, etc.) et les réutiliser à volonté.

Une fois les signatures importées sur Commons (lien désormais cliquable dans la colonne filename), l'image de la signature (et la catégorie Commons lorsqu'elle n'existe pas) peut être rajouté en masse via le schéma d'export de données Wikidata.

39 openrefine signature4

 

39 openrefine signature4

 

Pour terminer le processus, il suffit de vérifier que la signature illustre bien l'article Wikipédia (automatique s'il s'agit d'une infobox Wikidata), de créer la catégorie sur Commons et la rajouter dans Autres sites (tout en bas) sur Wikidata (Commons - Category:XXX). Ce sont, avec le détourage d'images bien sûr, les seules actions hors OpenRefine !

 

39 openrefine signature639 openrefine signature6

 

Les images importées sur Commons via OpenRefine sont automatiquement catégorisées "Uploaded with OpenRefine" (côté signatures, ça commence à être pas mal !)

 

[1] Telle que baptisée aux Archives nationales. Ce tutoriel est une version adaptée de la formation faite en interne en octobre 2021.