Qu'est-ce qui peut être amélioré avec Google Analytics ?


Google Analytics est un outil très pratique et accessible. Cependant il présente également quelques limites, même avec la version Premium.

Google-Analytics-Premium
Nous allons voir les 6 principales limites qui mériteraient une amélioration (des outils concurrents faisant mieux sur ces points).

Methode de calcul des sessions piégeuse

La methode de calcul des sessions est piégeuse pour un utilisateur novice : Le calcul des sessions se fait à partir du premier hit de la session. Ainsi, dans un rapport avec une métrique de niveau session, les infos sont celles du premier hit de la session (et pas des autres hits suivants), ce qui donne un rapport similaire aux entrées sur le site. A noter qu'il n'y a pas ce problème avec la metrique Utilisateur.

Par exemple, en combinant une variable enregistrant le nom du produit consulté et une metrique Sessions, on pourrait s'attendre à connaitre la liste des produits avec le nombre de consultations associées (sessions). Or le rapport que génèrera Google Analytics donnera plutôt la liste des produits qui ont été consultées en page d'entrée.

Il est possible de contourner cette méthode en passant par des segments, mais cela limite les analyses de grande taille possibles étant donné le nombre de segments/requêtes à utiliser.

Un echantillonnage incontournable

Même avec la version Premium, l’échantillonnage ne peut pas toujours être contourné. Il pose problème car il peut fausser les données lorsque l'on creuse trop (granularité avancée) ou que l'on étudie des valeurs extrêmes (ce qui arrive souvent en se concentrant sur certaines conversions, notamment pour les secteurs où le taux de conversion est faible).

Par exemple, il peut arriver que Google indique dans un rapport avec un fort échantillonnage un nombre de conversions pour une période de 3 mois de 100, alors que si on lance la même requête uniquement pour le dernier mois, le nombre de conversions sera supérieur à 100. En règle générale, avec l'échantillonage, Google Analytics donnera plutôt une bonne mesure de la tendance, plutôt qu'une bonne mesure des valeurs.

Même avec l'API, il n'y a pas de méthode pour contourner l'échantillonnage. Au contraire, dans certains cas, l'échantillonnage de l'API est différent de celui des rapports de l'interface !

Il existe plusieurs solutions manuelles de contournement, mais la seule solution universelle (qui répondra à tous les cas) est d'utiliser Big Query. Cependant cela demande de sortir de l'interface Google Analytics et demande un niveau avancé, ce qui n'est pas accessible à tout le monde.

Limite des rapports qui ne peuvent pas contenir plus de 2 dimensions

Les dashboards et reporting personnalisés dans l'interface ne permettent pas de construire un tableau contenant plus de 2 dimensions (affichés à l'écran).

Les solutions sont de passer par l'API et de sortir de l'interface Google Analytics, ce qui rend l'outil moins accessible à l'utilisateur novice (avec le plugin Google Sheet ou l'embed API via JS).

Une non prise en compte des valeurs vides

Les variables contenant des valeurs vides dans les hits ne sont pas prises en compte par Google Analytics (c'est principalement le cas pour les custom dimensions). Cela pose problème puisque dans certains cas le hit sera prise en compte dans les rapports et dans d'autres cas non. Ce qui peut fausser des rapports si on y prête pas attention.

Par exemple,on enregistre dans une custom dimension une caractéristique d'un produit. Si pour une raison technique ou une autre, sur une page d'un produit, l'information ne peut pas être renseignée, une valeur vide est envoyée. Si on regarde un rapport de ventes, le total sera de 100. Et si on rajoute dans ce rapport la custom dimension de la caractéristique du produit pour connaitre la répartition, le total passera à 80 (les 20 manquants correspondant aux ventes où la valeur vide a été envoyée). Au lieu de renseigner dans le rapport les 20 ventes pour avoir le même total (en mettant "not set" par exemple), Google analytics écartera du calcul pour le rapport, les hits contenant des valeurs vides (pour les dimensions concernées par le rapport).

La solution serait de remplir par défaut toutes les custom dimensions avec une valeur par défaut (via GTM). Ce qui peut représenter une certaine charge de travail et nécessite par conséquent un process de fiabilisation dans le temps.

Des analyses de chemins de navigation limitées

L'analyse des chemins de navigation est relativement limitée car elle se base uniquement sur les informations de la page précédente et la page suivante pour une page donnée (en plus de la première et la deuxième page vue dans la session). Tout est basé uniquement sur les séquence de 2 pages consécutives à partir desquelles une extrapolation est faite pour en déduire les séquences de 3, 4, 5 pages ou +. Le résultat de certains rapports de fluxs est donc à prendre avec précaution (surtout quand on observe des "boucles").

Par exemple, si une session passe de la page A à la page B et une autre session passe de la page B à la page A, en extrapolant, Google Analytics va en déduire qu'il y a des fluxs où la page A est consultée, puis la page B, puis la page A (A>B>A). Alors que cette séquence de 3 pages n'a pas eu lieu. Et à partir de cette déduction, une autre déduction sera faite pour la séquence de 4 pages : A>B>A>B.

La solution serait d'utiliser Big Query qui permet de connaitre la position de chaque hit dans la session. Ou de renseigner la position du hit dans une custom dimension (via GTM et cookie). Mais ceci est moins accessible et demande un niveau avancé.

Impossibilité de segmenter avec des conditions portant sur un même hit

Google Analytics ne permet pas de créer un segment où les conditions s'appliquent au même hit (et pas à la session ou à l'utilisateur).

Par exemple, si on enregistre dans des custom dimensions, le dispositif visité (partie du site) et une caractéristique du produit, et qu'on  souhaite créer un segment ne prenant en compte que les sessions ayant vu une caractéristique précise du produit sur un dispositif donné, alors on créera un segment avec 2 conditions (1 pour chaque variable) qui se combinent (en prenant l'intersection avec AND). Mais ce segment ne correspond pas exactement à ce qui est souhaité car il étudie la combinaison des conditions en regardant tous les hits d'une même session (au lieu de regarder pour un même hit donné). Le segment final créé donnera les sessions qui ont vu le dispositif et qui ont vu la caractéristique du produit, mais pas forcément sur la même page (pas au même moment dans la session).

La solution est de passer par Google Big Query avec les inconvénients correspondants.

 

Ceci dit, Google Analytics n'en reste pas moins un bel outil qui fait partie des meilleurs de sa catégorie et qui satisfera n'importe quel web analyst 🙂

0.00 avg. rating (0% score) - 0 votes

Laissez un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *