Analyse par les logs : avantages et inconvénients

Ayant terminé depuis quelques temps le fabuleux ouvrage d’Avinash Kaushik intitulé « Webanalytics – An hour a day« , je souhaiterais revenir sur l’analyse par log qu’il aborde dans son livre.

L’analyse d’un site par les weblogs est une méthode qui remonte à la création du web. Développée à l’origine pour faire remonter les différentes erreurs générées par les serveurs web, l’analyse des logs s’avère de nos jours être un facteur clé, aussi bien en référencement qu’en web-analytique.

Pour info, un log est un fichier regroupant l’ensemble des événements survenus sur un logiciel, une application, un serveur ou tout autre système informatique. Des logiciels gratuits tels que Webalizer sont spécialisés dans l’analyse de logs et dans la génération de rapports.

Les + :

  • Source de données la plus facilement accessible : il faut juste un serveur web.
  • Beaucoup de parsers par défaut et donc une possibilité de faire rapidement des reportings basiques.
  • Capacité à capturer l’ensemble des visiteurs (contrairement aux outils d’analyse par tags comme Google Analytics, Xiti…).
  • Etude du comportement des moteurs de recherche sur son site.
  • Etre en possession de ses données (pas d’outil d’analyse externe, pas d’intermédiaire externe).

Les – :

  • Destiné à la base pour capturer les informations techniques : aucune optimisation des données pour le marketing, les commerciaux ou encore la direction.
  • Nécessité d’avoir une très bonne collaboration entre le marketing et le service IT.
  • Bonne gestion des cookies sur le serveur obligatoire.
  • Les Weblogs capturent tout ce qu’il se passe sur le serveur : nettoyage nécessaire car pollution !
  • Gestion des proxy délicate !

A mon sens, l’analyse par log est surtout utile pour analyser le comportement des moteurs de recherche sur son site web. Par exemple, il arrive qu’un serveur web tombe assez souvent durant une période. Peut-être qu’un robot passe de manière excessive sur le site (ça m’est déjà arrivé avec le robot Voilà qui s’amusait à passer toutes les secondes et à faire plein de requêtes sur un de mes sites). Par ailleurs, il est possible de capturer le nombre total de visites pour évaluer le nombre d’internaute qui désactivent le javascript et les cookies mais ça ne me semble pas être le plus important.

9 réflexions au sujet de “Analyse par les logs : avantages et inconvénients”

  1. Les logs ont surtout la facheuse tendance à sur-comptabiliser les visites. En effet, un hit ne correspond pas à une page mais à un élément de la page. Donc une page peut contenir 10 hits. Je constate 30% de plus avec les logs.
    La technologie par marqueur est bien plus réaliste (même si selon l’outil, les résultats diffèrent.)

  2. D’où l’intérêt de l’utiliser surtout pour étudier le comportement des robots des moteurs par rapport au site :)

    Après, pour voir le nombre d’internautes, ça peut se faire, mais il y a un ménage préalable à entreprendre.

  3. Les outils de suivi non basés sur les fichiers de logs serveurs utilisent des marqueurs, autrement dit des bouts de code à insérer dans les pages que l’on veut tracker. Ces bouts de code (en tout cas ceux de Google Analytics et Xiti) sont conçu pour fonctionner même si le javascript est désactivé.

    Les outils de suivis non basés sur les logs serveurs nécessite donc une intervention technique sur toutes les pages de son site (ou au moins sur le fichier déterminant le footer de chaque page) : des oublis sont possibles ! De plus en plus de solutions sont publiées pour permettrent aux utilisateurs de bloquer le fonctionnement de ces marqueurs. J’ai notamment croisé un plugin FF permettant de bloquer les marqueurs Google Analytics…

    Conclusions : seuls les logs sont et resteront fiables ! Cependant, j’utilise les marqueurs sur mon site … question de facilité et de gain de temps lors de l’analyse ;)

    PS je vous conseille vivement la découverte de Piwik: http://ocarbone.free.fr/blog/?p=255 ; un outil similaire à Google Analytics permettant de rester en possession de ces données !

  4. Piwik est une simple évolution de PhpMyVisit non ? :)
    C’est juste le titre qui change mais je n’ai pas encore testé la toute dernière version =)

  5. Pour info, les solutions de mesure d’audience par tag sont nés de l’incapacité des analyseur de log à gérer les effets de cache des navigateurs…

    Les logs serveurs aussi ont leurs inconvénients :)

  6. Est-ce que quelqu’un aurait un bon logiciel d’analyse de fichiers logs ?
    Je précise logiciel et pas application web (type Webalyser, Piwik ou autre).

  7. Bonjour , j’aimerais utilisé un analyseur de log afin de déterminer les éventuelles occurences d’attaques sur mon serveur (ou mon réseau).

Laisser un commentaire