Sélectionner une page

Bonjour,

Souvent mes étudiants sont un peu confus quand il s’agit de charger leurs données dans R. Pour ma part je recommande l’import de fichiers en csv, plutôt que la lecture de fichiers Excel. En effet, les fichiers csv sont beaucoup plus simples dans leur structure (c’est seulement un fichier texte), et ne posent jamais de problème à l’import. Sauf…

Sauf si on se trompe entre read.csv() et read.csv2()…

Pourquoi 2 fonctions différentes pour faire la même chose ? Et bien c’est à cause des anglo-saxons. Ou de nous, je ne sais pas dire.

csv, ça veut dire Comma Separated Value. Donc, des colonnes séparées par des virgules. Le problème, c’est qu’en France, la virgule sert à séparer les unités des décimales, et donc on ne peut pas utiliser la virgule pour séparer les colonnes. Donc à la place on utilise… le point-virgule.

Finalement, on se retrouve avec 2 formats de fichiers complètement différents : les anglo-saxons ont des fichiers csv où les colonnes sont séparées par des virgules, et les unités et décimales sont séparées par un point. En France, on utilise un format où les colonnes sont séparées par des points-virgules, et les décimales par des virgules.

Voilà pourquoi read.csv et read.csv2 sont des fonctions un peu différentes ! read.csv est la fonction originale, pour lire les csv anglo-saxons, et read.csv2 est la fonction modifiée pour lire les csv français.

Facile non ?

 

Restez informé !

Inscrivez-vous à la Newsletter pour être tenu au courant des nouveaux articles

Pin It on Pinterest

Share This