Sélectionner une page

Bonjour Internet,

Imaginez, vous trouvez un graph dans un vieux papier, une vieille publi, et vous voudriez récupérer les données de ce graph pour pouvoir les retravailler sous R. Il y a plein d’outils qui permettent de faire ça, mais il y a surtout un package R, qui est assez fabuleux : digitize

Le principe de digitize est tout bête : à partir de l’image du graphique, vous cliquez sur les points avec votre souris et pof, ça vous stocke tout ça dans un dataframe. Le secret derrière le package, c’est la fonction locator(), de R, qui permet de récupérer les coordonnées d’un point en cliquant avec la souris.

Donc pour l’exemple et la démonstration, je vais travailler avec la figure de l’article qui parle de l’effet Dunning-Kruger. La représentation qu’on a de cet effet est en général fausse. Donc l’idée est de repartir des données de l’étude. Voici un des graphiques de l’étude, pour lequel on va essayer de récupérer les données :

La figure originale de l’article de Kruger et Dunning, 1999

Première chose à faire, enregistrer la figure quelque part. Pour extraire la figure d’un pdf, vous pouvez juste faire une capture d’écran, ça marche très bien pour notre propos. 

Ensuite vous ouvrez R, vous chargez la librairie digitize, et vous avez quasi fini. Pour la procédure, c’est quand même plus facile à suivre ici :

Mais avec tout ça, on peut facilement refaire la figure contenu dans le papier original, mais en beaucoup plus classe.

Le graph fini : 

Et en bidouillant un peu, on peut même redessiner la “vraie” courbe de l’effet Dunning-Kruger. Par exemple ici, on a la compétence perçue en fonction de la compétence réelle. On est bien loi de l’illustration classique de la chose.

On voit donc bien que récupérer les données d’un graph, ça sert à davantage de choses que juste refaire le même graph que l’original mais en plus beau. On peut faire des autres graphiques avec les même données. Et ça c’est beau.. Et oui.

Bref, une fois qu’on a les données on peut faire tout un tas de trucs débiles, comme refaire le graph avec des amibes, avec le package ggprotist que j’ai commencé à dev :

ça ne sert strictement à rien, mais c’est rigolo.

Voilà, vous savez tout. Donc si vous trouvez un graphique un peu pourri dans un document, et que vous voulez le refaire tout bien, vous connaissez la marche à suivre !

Pin It on Pinterest

Share This