Comment fusionner 2 data frames (ajout des données à la suite des autres) avec R ?

Il existe 2 methodes pour fusionner les données de 2 data frame (en ajoutant les données les unes à la suite des autres). Pour fusionner les données, il est nécessaire que les 2 data frames aient les mêmes noms de colonne.

La méthode classique est de faire appel à la fonction native rbind() :

data1 <- data.frame( v1=c("a","b","c"), v2=c(1,2,3) )
data2 <- data.frame( v1= c("d","e"), v2=c(4,5) )
data_new <- rbind(data1, data2)

L’autre methode est celle de la librairie dplyr avec la fonction bind_rows():

data1 <- data.frame( v1=c("a","b","c"), v2=c(1,2,3) )
data2 <- data.frame( v1= c("d","e"), v2=c(4,5) )
library(dplyr)
data_new <- bind_rows(data1, data2)

L’avantage de cette méthode avec bind_rows est qu’elle ne génere pas d’erreurs si un data frame contient une colonne qui n’est pas présente dans l’autre (ce qui permet d’eviter une étape de « preparation ») (par defaut, la nouvelle colonne sera ajoutée et les lignes du data frame n’ayant pas la colonne auront la valeur vide « NA »).

Pour + d’infos :

https://dplyr.tidyverse.org/reference/bind_rows.html

0.00 avg. rating (0% score) - 0 votes

Laissez un commentaire Annuler la réponse