Ayant terminé depuis quelques temps le fabuleux ouvrage d’Avinash Kaushik intitulé « Webanalytics – An hour a day« , je souhaiterais revenir sur l’analyse par log qu’il aborde dans son livre.

L’analyse d’un site par les weblogs est une méthode qui remonte à la création du web. Développée à l’origine pour faire remonter les différentes erreurs générées par les serveurs web, l’analyse des logs s’avère de nos jours être un facteur clé, aussi bien en référencement qu’en web-analytique.

Pour info, un log est un fichier regroupant l’ensemble des événements survenus sur un logiciel, une application, un serveur ou tout autre système informatique. Des logiciels gratuits tels que Webalizer sont spécialisés dans l’analyse de logs et dans la génération de rapports.

Les + :

  • Source de données la plus facilement accessible : il faut juste un serveur web.
  • Beaucoup de parsers par défaut et donc une possibilité de faire rapidement des reportings basiques.
  • Capacité à capturer l’ensemble des visiteurs (contrairement aux outils d’analyse par tags comme Google Analytics, Xiti…).
  • Etude du comportement des moteurs de recherche sur son site.
  • Etre en possession de ses données (pas d’outil d’analyse externe, pas d’intermédiaire externe).

Les – :

  • Destiné à la base pour capturer les informations techniques : aucune optimisation des données pour le marketing, les commerciaux ou encore la direction.
  • Nécessité d’avoir une très bonne collaboration entre le marketing et le service IT.
  • Bonne gestion des cookies sur le serveur obligatoire.
  • Les Weblogs capturent tout ce qu’il se passe sur le serveur : nettoyage nécessaire car pollution !
  • Gestion des proxy délicate !

A mon sens, l’analyse par log est surtout utile pour analyser le comportement des moteurs de recherche sur son site web. Par exemple, il arrive qu’un serveur web tombe assez souvent durant une période. Peut-être qu’un robot passe de manière excessive sur le site (ça m’est déjà arrivé avec le robot Voilà qui s’amusait à passer toutes les secondes et à faire plein de requêtes sur un de mes sites). Par ailleurs, il est possible de capturer le nombre total de visites pour évaluer le nombre d’internaute qui désactivent le javascript et les cookies mais ça ne me semble pas être le plus important.