Si le package Rcmdr n’est pas dejà installé dans Rstudio, il faut l’installer via l’onglet Packages > Install Et pour lancer l’interface de Rcommander, il suffit de taper la ligne de commande suivante : Ensuite, activer la librairie dans R […]
Statistiques
Lorsqu’on réalise une analyse factorielle, on simplifie la représentation du jeu de données à partir de dimensions. Ceci permet de mieux expliquer les choses en se concentrant sur l’essentiel. Le principe de l’analyse factorielle revient à avoir une vue d’ensemble […]
Une analyse factorielle est utile pour synthétiser l’information contenue dans un grand jeu de données (avec de multiples variables). Le but est d’avoir un minimum de dimensions ou facteur (combinaison de variables) qui expliquent le maximum de la variance du […]
Pour expliquer des liens entre variables, on procède souvent à une régression linéaire qui va modéliser les liens entre une variable expliquée et les variables explicatives (qui permettent de l’expliquer). Nous allons prendre comme exemple le dataset UScereal pour expliquer […]
Visualiser la distribution d’une série de données peut être utile pour avoir un premier aperçu des données, avant de faire des tests statistiques. Ceci peut se faire avec un graphique de distribution appelé box plot ou boites à moustaches. Un […]
Nous allons voir comment faire le test du chi-deux (ou khi-carré) avec R. Pour cela nous allons utiliser le package Rcmdr qui applique une interface graphique à R. Le test du chi-deux permet de tester l’indépendance entre des variables qualitatives. […]
Nous allons voir comment réaliser un test de proportion avec R Commander. R Commander est un des « packages » de R. Il permet d’utiliser la puissance de R pour les calculs statistiques en lui associant une interface graphique facilitant son utilisation. […]
Nous allons voir comment réaliser une ANOVA lorsque nos données concernent différents échantillons (plus de 2). Pour cela, nous allons utiliser R (avec Excel, il n’est possible de faire une ANOVA qu’avec 2 échantillons différents). ANOVA signifie Analyse Of Variance. […]
Pour comparer 2 échantillons, il est possible de réaliser un t-test. Nous allons voir les différentes façons de faire le test de Student avec ses variantes. Le t-test teste l’hypothèse nulle qui veut que les moyennes des 2 échantillons soient […]
Avant de lancer un test statistique, il convient parfois d’organiser les données afin de les présenter au format adéquat. Nous allons prendre l’exemple du set de données ci-dessous que nous allons préparer à un test de Student (t-test). Pour préparer […]
Pour répondre à certaines questions, il peut être nécessaire de réaliser des tests statistiques. Ces tests permettent, à partir d’échantillons, d’affirmer ou rejeter une hypothèse selon un degré de certitude choisi (souvent on prend la probabilité d’avoir raison dans 95% […]
Pour faire des tests statistiques sur des données Excel, il est préférable d’utiliser Rstudio plutôt que l’add-in Analysis Toolpak d’Excel qui ne contient que quelques tests basiques. Excel a l’avantage de pouvoir travailler facilement les données, notamment pour des calculs […]