Billets de la catégorie : Statistiques


Comment faire une classification avec R Commander ?

Lorsqu'on réalise une analyse factorielle, on simplifie la représentation du jeu de données à partir de dimensions. Ceci permet de mieux expliquer les choses en se concentrant sur l'essentiel. Le principe de l'analyse factorielle revient à avoir une vue d'ensemble avant de rentrer dans les détails (si nécessaire). Cette simplification peut également servir comme base […]

Classification-classes

ACP-graphique-variables

Comment faire une analyse factorielle avec R Commander ?

Une analyse factorielle est utile pour synthétiser l'information contenue dans un grand jeu de données (avec de multiples variables). Le but est d'avoir un minimum de dimensions ou facteur (combinaison de variables) qui expliquent le maximum de la variance du jeu de données. Il existe différentes façons de faire une analyse factorielle. Si les variables […]


Comment faire une regression linéaire avec R ?

Pour expliquer des liens entre variables, on procède souvent à une régression linéaire qui va modéliser les liens entre une variable expliquée et les variables explicatives (qui permettent de l'expliquer). Nous allons prendre comme exemple le dataset UScereal pour expliquer les valeurs en calories des céréales en fonction de leurs caractéristiques (graisse, fibres, potassium, sodium, […]

Sous-modele

Box-plot

Comment visualiser une distribution avec des box plots ?

Visualiser la distribution d'une série de données peut être utile pour avoir un premier aperçu des données, avant de faire des tests statistiques. Ceci peut se faire avec un graphique de distribution appelé box plot ou boites à moustaches. Un box plot représente les différentes caractéristiques d'une distribution : La moyenne La médiane Les quartiles […]


Comment faire le test du chi-deux avec R-Commander ?

Nous allons voir comment faire le test du chi-deux (ou khi-carré) avec R. Pour cela nous allons utiliser le package Rcmdr qui applique une interface graphique à R. Le test du chi-deux permet de tester l'indépendance entre des variables qualitatives. Le principe du test repose sur une table de contingence où on comparera les valeurs […]

table-contingence-chi-deux

test-proportion

Comment faire un test de proportion avec R-Commander?

Nous allons voir comment réaliser un test de proportion avec R Commander. R Commander est un des "packages" de R. Il permet d'utiliser la puissance de R pour les calculs statistiques en lui associant une interface graphique facilitant son utilisation. Le test de proportion convient lorsqu'on souhaite savoir si des groupes/échantillons sont différents et qu'on […]


Comment faire une ANOVA avec plusieurs echantillons ?

Nous allons voir comment réaliser une ANOVA lorsque nos données concernent différents échantillons (plus de 2). Pour cela, nous allons utiliser R (avec Excel, il n'est possible de faire une ANOVA qu'avec 2 échantillons différents). ANOVA signifie Analyse Of Variance. C'est un test basé sur le test de Fisher (pour les variances) qui vérifie si […]

ANOVA-One-way-900x306

t-test

Comment faire les différents t-test ?

Pour comparer 2 échantillons, il est possible de réaliser un t-test. Nous allons voir les différentes façons de faire le test de Student avec ses variantes. Le t-test teste l'hypothèse nulle qui veut que les moyennes des 2 échantillons soient égales (moyenne1=moyenne2). Il existe 2 facons de poser cette hypothèse nulle, soit en considérant que […]


Comment préparer les données avant un test statistique avec Excel ?

Avant de lancer un test statistique, il convient parfois d'organiser les données afin de les présenter au format adéquat. Nous allons prendre l'exemple du set de données ci-dessous que nous allons préparer à un test de Student (t-test). Pour préparer les données, il faut : Structurer les données Enlever les données incomplètes Vérifier la distribution […]

Data-set

tests-statistiques

Quels tests statistiques faire ?

Pour répondre à certaines questions, il peut être nécessaire de réaliser des tests statistiques. Ces tests permettent, à partir d'échantillons, d'affirmer ou rejeter une hypothèse selon un degré de certitude choisi (souvent on prend la probabilité d'avoir raison dans 95% des cas). Cependant pour qu'un test statistique soit fiable, les données doivent satisfaire certaines conditions. […]