Le travail du Web Analyst peut être effectué de différentes façons selon les environnements de travail dans lequel il évolue.Certains aspects sont plus prédominants que d’autres dans certaines entreprises en fonction de leur business model. Et certaines directions ont plus […]
Lorsqu’on réalise une analyse factorielle, on simplifie la représentation du jeu de données à partir de dimensions. Ceci permet de mieux expliquer les choses en se concentrant sur l’essentiel. Le principe de l’analyse factorielle revient à avoir une vue d’ensemble […]
Une analyse factorielle est utile pour synthétiser l’information contenue dans un grand jeu de données (avec de multiples variables). Le but est d’avoir un minimum de dimensions ou facteur (combinaison de variables) qui expliquent le maximum de la variance du […]
Pour expliquer des liens entre variables, on procède souvent à une régression linéaire qui va modéliser les liens entre une variable expliquée et les variables explicatives (qui permettent de l’expliquer). Nous allons prendre comme exemple le dataset UScereal pour expliquer […]
En France, le format standard d’une décimale est la virgule. Mais dans le monde anglo-saxon, la décimale s’écrit avec un point et le séparateur de milliers avec une virgule. Si vous recevez des données au format anglo-saxon, il est possible […]
L’intérêt de R est de proposer une solution gratuite, mais surtout ouverte qui permet à sa communauté de pouvoir constamment proposer de nouvelles fonctionnalités. Ces évolutions se font avec ce qu’on appelle des packages qui sont des librairies de fonctions […]
Visualiser la distribution d’une série de données peut être utile pour avoir un premier aperçu des données, avant de faire des tests statistiques. Ceci peut se faire avec un graphique de distribution appelé box plot ou boites à moustaches. Un […]
Nous allons voir comment faire le test du chi-deux (ou khi-carré) avec R. Pour cela nous allons utiliser le package Rcmdr qui applique une interface graphique à R. Le test du chi-deux permet de tester l’indépendance entre des variables qualitatives. […]
Nous allons voir comment réaliser un test de proportion avec R Commander. R Commander est un des « packages » de R. Il permet d’utiliser la puissance de R pour les calculs statistiques en lui associant une interface graphique facilitant son utilisation. […]
Nous allons voir comment réaliser une ANOVA lorsque nos données concernent différents échantillons (plus de 2). Pour cela, nous allons utiliser R (avec Excel, il n’est possible de faire une ANOVA qu’avec 2 échantillons différents). ANOVA signifie Analyse Of Variance. […]
Pour comparer 2 échantillons, il est possible de réaliser un t-test. Nous allons voir les différentes façons de faire le test de Student avec ses variantes. Le t-test teste l’hypothèse nulle qui veut que les moyennes des 2 échantillons soient […]
Avant de lancer un test statistique, il convient parfois d’organiser les données afin de les présenter au format adéquat. Nous allons prendre l’exemple du set de données ci-dessous que nous allons préparer à un test de Student (t-test). Pour préparer […]