revival

Ça y est ! Après plusieurs mois, la pénalité automatique reçue de la part de Google sur mon blog s’est enfin volatilisée. Pour ceux et celles qui s’en souviennent, à l’époque où j’étais hébergé chez Dreamhost, je me suis fait hacker la plupart de mes sites mais c’est surtout le blog qui en avait pris plein la gueule…

Alors je l’annonce tout de suite, si la pénalité a pris tant de temps à disparaître, c’est tout simplement parce que je n’ai pas pris le temps suffisant d’explorer les possibilités. Et bien sûr, je ne vis pas de mon blog. Fort heureusement, à la mi-février de cette année, j’ai décidé de régler le problème une bonne fois pour toute.

1. Rappel des dates clés :

  • Décembre 2011 : hack de mes sites avec le plus intense sur blog.ramenos.net
  • Mai 2012 : application d’une pénalité manuelle
  • Octobre 2012 : application de la pénalité automatique
  • 17 mars 2015 : fin de la pénalité

La pénalité automatique fut la suivante : l’intégralité de mes posts parus à partir de la fin 2012 n’apparaissaient plus dans les résultats de recherche Google. J’avais beau taper le titre exact du post, c’était la page d’accueil ou la page de liste catégorie qui ressortait… Problématique. En revanche, en copiant l’URL du post, celle-ci était bien indexée dans le moteur. Quant à la page d’accueil du blog, aucun souci, elle était correctement indexée et positionnée, ainsi que les posts antérieurs à 2012.

2. Qu’est-ce que j’ai fait suite à cela ?

Si j’ai pris mon temps avant de résoudre le tout (comme dit plus haut, je ne vis pas de mon blog), J’ai bien évidemment commencé par l’essentiel, à savoir :

  1. Changer d’hébergeur (je ne vous recommande vraiment pas Dreamhost malgré le prix attractif)
  2. Réinstaller le CMS de A à Z et utiliser un thème officiel propre et tout neuf
  3. Changer tous les mots de passe

Par la suite, je me suis penché sur l’analyse de mes logs. J’ai d’ailleurs pu découvrir l’ensemble (ou presque) des URL pourries générées par le hack. Et croyez-moi, le cialis, le viagra et autres mots clés joyeux, j’en avais à la pelle sur le blog.

3. On creuse, on étudie les différentes possibilités et on corrige/sécurise

J’ai passé un bon bout de temps à étudier les patterns d’URL qui avaient été générés. Comme le hack était terminé, les URL renvoyaient des erreurs 404 mais restaient trouvables par Google. J’ai donc décidé de rediriger toutes ces vilaines URL vers des pages 410. Pour cela, j’ai pu m’aider de l’extension 410 for WordPress qui m’a permis d’y aller pattern par pattern.

J’en ai profité au passage pour corriger un peu de duplication de contenus (WordPress et ses imperfections). Malgré tout, la pénalité Google est restée en place. J’ai donc continué en m’intéressant d’un peu plus près à l’outil de désaveu de liens fournit par Google. Récupérer l’ensemble des domaines qui m’avaient pourri la vie n’a par contre, pas été si complexe que ça. Bref, je fais le fichier selon les normes Google, je le soumets et j’attends… Rien !

J’en profite au passage pour vous faire part de mon avis sur cet outil : il n’est clairement pas à la hauteur de ce qu’il prétend être et j’ai l’impression que Google ne tient pas spécialement compte de ce que vous mettez dedans… Et ce, même à l’heure actuelle.

Le temps passe et je peux voir dans Webmaster Tools que les 404 supplémentaires ont disparu, que la fréquence de crawl repart à la normale et qu’il ne semble pas y avoir de souci au niveau de la duplication de contenus. Plus d’actions manuelles non plus (j’avais reçu quelques alertes 2 jours après le hack). Bonne nouvelle, sauf que la pénalité est toujours en place, et ce, plusieurs mois après : les posts précédents la date du hack se positionne bien dans les SERP mais les nouveaux continuent d’être invisibles.

En parallèle, j’en avais profité pour renforcer un peu le fichier .htaccess et vérifier si de nouvelles règles avaient été ajoutées. Je me limite à quelques extensions WordPress seulement. J’en profite aussi pour voir s’il y a du code HTML et JS injectés dans mes pages ou quelque chose d’étrange… Rien non plus là-dessus.

J’ai effectué d’autres actions et correctifs en parallèle pour lesquels il n’y a eu aucun effet positif au niveau de la pénalité.

4. Trackbacks et URL des auteurs sont coupables

Puis un jour, je découvre par le plus grand des hasards que quelques (et comptez bien cela sur les doigts des 2 mains) trackbacks étranges ont fait leur apparition sur des posts antérieures à 2012… Tiens, tiens, un trackback vers un site en .ru ? Suspect. Un .jp ? Toujours suspect… Ohhh un magnifique free-porn-porn.machinchouette a fait son apparition aussi : ça sent mauvais tout cela. Tous ces liens pointaient vers des pages parking ou des 404 mais pas la peine de réfléchir avant de les supprimer.

J’en ai profité pour analyser un peu les URL on post que j’avais moi-même rentré. Anciennement, la plupart de ces URL pointaient vers des moteurs de recherche alternatifs du génie ou alors des sites d’information… Dorénavant, ils pointent vers des pages parking, des sites web où l’on fait du speed dating étrange par webcam ou encore des produits de beautés dont la composition et le marketing me laissent perplexes… Bref, le web a bien changé à certains endroits.

Tant qu’à bien faire le tour, il est temps de rejeter un coup d’œil à certains vieux commentaires qui ont été fait sur le blog avant 2010. Et vu qu’il y avait pas mal de cas isolés, j’ai fait un gros ménage de tous les trackbacks et liens sur le nom des auteurs de commentaires à travers l’intégralité des posts du blog. J’en ai profité aussi pour supprimer (à la main) les liens dans les posts qui pointent vers des sites qui ne correspondent plus à ce qui avait été abordé. Et croyez-moi, ça peut paraître tellement évident que ça ne l’est pas.

Quelques commandes SQL exécutées et pouf, 3 jours après, la pénalité automatique est levée.

5. Ce que je retiens de cette expérience

  • J’ai sauvé des clients de pénalités automatiques et manuelles au cours de ma carrière mais j’ai négligé (à tort) mon cher blog pendant trop longtemps : j’ai beau revoir mes priorités dans la vie, j’en suis responsable et j’aurai pu régler le tout en quelques mois.
  • Entre 2008 et 2015, la tolérance de Google vis-à-vis de certains liens a clairement changé (ok, on le sait déjà mais ça fait un cas pratique supplémentaire pour voir que c’est véritable) et ça prouve qu’il faut faire le ménage dans les coins poussiéreux sur son site.
  • Même si je n’ai pas trouvé le problème du premier coup, ça m’a permis de faire un sacré ménage au niveau du blog, de la BDD et des règles Apache. Si vous avez un blog depuis fort longtemps, allez jeter un coup d’œil à vos vieux posts, voire à votre structure toute entière.
  • Avant 2009, j’étais bien plus tolérant sur la qualité des commentaires que je recevais sur mes posts (grave erreur)
  • Ça m’a permis de me remettre dans ma peau en 2010 et avant. Mon but était (et est toujours) de partager mon expérience et en débattre au besoin à travers les commentaires. Je pense qu’il faut rappeler l’essence même du commentaire du blog : échanger, confirmer ou infirmer en argumentant ce que l’on lit pour créer un échange objectif avec l’auteur… Et non rédiger un commentaire à 3 sous avec un lien.