Parmi les différents types de données dans R, les listes sont les solutions les plus flexibles. Elles permettent de stocker en série des données de types différents et d’y accéder facilement. Pour créer une liste, il suffit de faire appel […]
Programmation
La fonction permettant d’appliquer des regles conditionnelles est which(). Cette fonction s’applique sur des vecteurs, donc également sur des elements du dataframe de type vecteur (noms des colonnes ou valeurs des colonnes par exemple). Cette fonction va appliquer la règle […]
Pour manipuler les données et pouvoir réaliser des calculs personnalisés, il est primordial de savoir comment interagir avec les différents elements d’un data frame (le format standard dans lequel sont normalement stockées les données). Cet article va lister différentes méthodes […]
La fonction case_when() est incluse dans la librairie dplyr pour la manipulation des données. Sa valeur ajoutée est de permettre de réaliser d’un seul coup plusieurs règles conditionnelles (autrement dit, elle permet de faire plusieurs if … else if … […]
La librairie dplyr facilite la manipulation des données. Elle permet notamment de faire des « chainages », c’est à dire d’ecrire son code en faisant référence à des séquences de fonctions à executer les unes après les autres, ceci facilite l’ecriture (en […]
Avec R, il existe plusieurs classes de données (matrix, list, etc) dont les « data frames » qui correspondent à des tableaux de données où chaque ligne correspond à une mesure faite sur plusieurs axes (chaque axe étant une colonne). Cette structure […]
Pour préciser des chemins d’accès à des dossiers ou des fichiers, il est possible de les saisir manuellement, ce qui est peu pratique et est source d’erreurs. Il est préférable de réaliser cette tâche via une interface. Ce qui permet […]
La fonction à utiliser est write.table(). Elle a plusieurs parametres : Pour préciser le chemin d’accès, il est conseillé de passer par choose.dir() pour avoir une interface pour le sélectionner. Ce qui est plus rapide que d’avoir à le taper […]
Plusieurs methodes existent dans R pour importer les données d’un fichier csv (fichier texte ou le separateur est une virgule) et un fichier texte (le plus souvent le separateur est alors la tabulation). La méthode native fait appel à la […]
Lors d’un précédent article, on avait parlé d’une méthode pour générer une visualisation en soleil (sunburst) avec les données de Google Analytics (via Big Query) : https://www.webanalytix.fr/comment-visualiser-les-parcours-de-google-analytics-avec-un-sunburst-via-r/ Cette méthode s’applique très bien aussi pour une analyse avec les données de […]
Les tables Bigquery peuvent contenir des Petabytes de données (1PB = 1024 TB) et les requêtes peuvent donner un résultat en quelques secondes. Cela est possible grâce à la structure spécifique des tables qui sont « en relief ». C’est à dire […]
Il est utile de faire appel à d’autres scripts dans R pour construire son code avec une organisation en modules. Cela a pour avantage de gagner en efficacité pour corriger des problèmes et d’avoir un code plus léger. Pour appeler […]