Que faire du contenu expiré d’un site web ?

Parmi les tâches ingrates du référenceur, il y a ce que j’appelle “dealer” avec le contenu expiré des sites web.

Qu’est-ce que j’entends par contenus expirés ?

  • Les pages volontairement introuvables.
  • Les contenus inexistants à cause des backlinks pourris.
  • Les contenus à durée de vie limitée (par exemple un concours, une promotion…).
  • Les contenus voués à disparaître dans les prochains jours (semaines ?) pour une raison politique ou économique un peu obscure.

Généralement, si vos collaborateurs sont conscients de l’importance du SEO pour leur site web, ils vous préviennent quelques semaines avant (en tout cas, c’est mon cas et j’en suis déjà heureux).

Récemment, j’ai fait un énorme ménage au niveau des landing pages cassées. J’y ai passé pas mal d’heures, ce n’est pas joyeux mais il faut le faire. Et puis au passage, ça m’a donné l’idée d’écrire un post sur le sujet. Bref, dans ces conditions, que faut-il faire ?

Option 1 – Conserver le contenu

Si vous avez de la chance, qu’on vous écoute et que vous arrivez à prouver le potentiel de conservation de tels et tels contenus, cette option peut être considérée comme la plus facile qui soit, voire la plus “safe”.

En effet, dans ce cas, il n’y a pratiquement rien à faire de votre côté, pas de modification technique (ou alors souvent mineure comme retirer un info X pour des raisons commerciales).

Cependant, si vous prenez le temps de regarder de quels types de contenus il s’agit, peut-être serait-il judicieux de ne conserver que ce qui vaut la peine, afin d’augmenter la qualité de vos visites.

En effet, imaginons que vous soyez un magazine et qu’un de vos objectifs soit de générer beaucoup de pages vues/visite. Préféreriez-vous avoir 250 000 visites/mois à 2 pages vues ou alors 220 000 visites/mois à 3,15 pages vues/mois ?

De plus, si vos contenus sont vraiment moisis, ça risque d’augmenter le taux de rebond de la plupart de vos pages. Et qui dit taux de rebond élevé avec plein de back vers Google dit… Pas forcément des bonnes choses pour la notoriété naturelle de votre domaine.

Bref, avant de sauter de joie et même en ayant prouvé que ces contenus expirés représentent une bonne partie de votre “trafic brut” en SEO, regardez d’un peu plus près ce qu’ils valent vraiment.

Option 2 – Afficher une page 404

La page 404, communément appelée “page pour le contenu introuvable” est obligatoire sur un site. En effet, elle permet aux moteurs de recherche d’interpréter correctement la page d’arrivée comme une page d’erreur, introuvable…

Le seul souci avec la 404 est qu’elle est introuvable justement. Cela signifie que les moteurs ne doivent pas l’indexer (si c’est le cas, vérifiez que vos pages 404 renvoient bien un code d’erreur 404 en utilisant une petite extension de type HTTPFox par exemple).

Cependant, en affichant une page 404 personnalisée, on peut améliorer l’expérience utilisateur. N’oubliez pas que l’utilisateur sera bien frustré d’arriver sur une page d’erreur au lieu de son contenu.

De ce fait, si cela est possible, veillez à ce que cet atterrissage se fasse en douceur… Par exemple en préconisant de faire un peu d’humour sur la page en question.

Bien sûr, ajouter des éléments supplémentaires permet toujours de donner une solution alternative à l’utilisateur, mais au final, utiliser une 404 sur des contenus expirés pour “conserver son SEO” n’est pas la solution à employer.

Option 3 – Afficher une page 410

Si la page d’erreur 410 n’est pas non plus la solution pour “conserver le potentiel SEO” de vos pages disparues, elle a néanmoins le mérite d’être plus claire vis à des moteurs de recherche.

Pour rappel, le code http 410 est interprété par les bots comme une page qui est “volontairement introuvable”.

De ce fait, les pages qui renvoient ce code d’erreur disparaissent plus rapidement de l’index des moteurs, ce qui peut s’avérer pratique lorsqu’on doit rendre rapidement une page moins facilement trouvable pour une raison X ou Y.

Option 4 – Rediriger les contenus via des 301

Cette dernière option, qui constitue bien souvent la meilleure, consiste à rediriger les URL des contenus disparus vers leur équivalent existant.

Bien souvent, c’est cette solution que j’emploie et que je préconise. En effet, la redirection permanente d’une URL vers son équivalent constitue souvent le meilleur moyen de transférer les performances organiques d’une page à une autre, de minimiser les risques d’un fort taux de rebond et enfin d’éviter de créer davantage de pages 404.

Attention : si la redirection propre d’un grand nombre d’URL est une bonne solution, faites attention de ne pas blinder votre fichier .htaccess. En effet, dites-vous que ce fichier est chargé à chaque appel du domaine donc s’il commence à faire plus de 300ko, ça va faire mal au niveau des performances.

En revanche, rien ne vous empêche de mettre une solution alternative en place pour faire des redirections 301 (je ne parle pas de canonical, mais d’une vraie solution alternative technique pour vos redirections “extra”).

Cependant, pour que cela fonctionne, il ne faut pas être fainéant et recherchez réellement la page équivalente ou qui sera la plus en harmonie avec la précédente. Si c’est pour tout rediriger vers votre home ou une catégorie comme un bourrin, passez votre chemin.

Prenons un exemple : je décide de supprimer la recette de tarte au citron de Jacqueline car celle-ci n’aime plus mon site web et ne souhaite plus faire apparaître son contenu dessus.

Si on résume mes solutions proposées, voilà ce que ça donnerait :

  • Je conserve le contenu (mais je pense que Jacqueline va me taper sur la tête ou pire, m’envoyer son fils Jeannot qui est avocat).
  • Effacer le contenu et renvoyer sur une page 404/410 (dommage pour ceux qui avaient la recette en favori).
  • Trouver une page qui pourrait faire l’affaire et rediriger l’URL vers cette page (par exemple la page qui liste les recettes de tartes ou mieux, la recette de tarte à la lime de Bernadette).

Si mon choix est fait, que choisiriez-vous ? Et pourquoi ?

Note : si vous avez envie de partir à la chasse au 404, n’hésitez pas à aller faire un tour dans Google Webmaster Tools. Vous trouverez un bon filon de 404 que vous pourrez vous amuser à rediriger proprement en 301 vers leur équivalent.

Perso, il m’arrive parfois de faire un gros ménage là-dedans. C’est chiant, pas passionnant mais ça permet de faire un bon ménage et de gagner quelques visites gratuitement au passage.

Have fun !

13 réflexions au sujet de “Que faire du contenu expiré d’un site web ?”

  1. Hello,

    Je suis généralement d’avis de mettre des 301 dans la mesure du possible. Puisque qu’on parle beaucoup d’expérience utilisateur ces derniers jours, je trouve que c’est le mieux à faire.

    Si une 301 n’est pas possible alors je privilégierai aussi les 410 pour ne pas voir s’amasser des 404 dans GWT c’est vrai que c’est chiant à nettoyer :p

  2. Bonjour,

    On utilise en général la redirection 301, je pense que c’est la meilleure solution pour les contenus expirés. Google met à jour son index et tout le monde est content.

    Une autre solution s’il s’agit de contenu {rapidement|fréquemment} expiré consiste à utiliser une URL fixe pour ces contenus. Seul le contenu change, mais l’URL reste toujours la même ce qui peut éviter la mise en place de très nombreuses redirections 301 et permet de conserver intégralement le bénéfice des liens externes qui auront été faits sur cette page.

    C’est pas toujours possible pour plein de raisons, mais ça peut parfois être une solution.

  3. Sans aucune retenue j’opte aussi pour les 301, mais on rencontre parfois le problème de client qui enchainent les 301 l’une après l’autre, au bout d’un moment, google a du mal à suivre.

    Sylvain (oui parce que Lily c’est pas vraiment mon non :-) )

  4. Bonjour,

    Je pense que les 301 sont effectivement le plus pertinent lorsuqe l’on a un nombre limité de pages à rediriger (disons 200 maxi).

    Cela peut être beaucoup plus délicat avec un nombre très conséquent de pages indisponibles (exemple de site e-commerce dont les produits sont désormais hors stock).

  5. L’article a été mis à jour. Attention au poids de votre fichier htaccess… :)

  6. Hello

    Il y a aussi l’option NoIndex.
    L’option 301 ne peut pas s’appliquer à des sites avec des milliers de produits qui bougent (entrées/sorties) tous les jours. et comme tu le constates “bonjour le poids du .htaccess” .

    J’ai utilisé le 410 pendant qqs mois,
    le GWT les a comptabilisé dans les introuvables.
    Je les vire, GWT ne les remet pas.
    Pour les 404, elles reviennent sur le GWT donc … 410 meilleurs que 404

    Je passe au NoIndex
    mais il n’y a pas de solutions réellement agréées Google.

    David

  7. Excellent billet ! Il fait un point intéressant sur une problématique finalement centrale du Web : que faire de ce qui n’existe plus ?
    C’est en lien direct avec mon mémoire sur le déchet numérique. =)
    Puis-je me permettre de te citer ? :)

  8. Si on parle d’un véritable contenu “expiré”, il convient de le recycler d’une manière intelligente. Pour un concours terminé par exemple, présenter correctement les résultats du concours, le nombre de participants, etc. Et bien sur, faire un lien vers un nouveau concours, ou prévoir un call to action clair !

    Bien sur, une 301 fera bien l’affaire, mais attention à la page affichée. L’utilisateur qui obtient une page très différente du résultat de la SERP aura tendance à bounce back aux résultats (même si je ne sais pas pour quelle page sera comptabilisé ce bounce !).

    Pour du contenu qui n’a plus lieu d’être, par ex les pages UGC retirées par les utilisateurs, un code 410 est efficace !

  9. Pour ma part une fois l’annonce périmée (véhicule vendu donc) j’utilise les 404 pour prévenir les moteurs et les utilisateurs, en essayant de rediriger au mieux vers des annonces/rubriques similaires. Puis au bout de 15 jours je passe en 301 vers la rubrique présentant les annonces du même modèle. Un mix des options 2 et 4 en somme :)

  10. Je vois que tu parles de la “lourdeur” d’un gros htaccess. J’y étais moi aussi sensible mais un jour je suis tombé sur un site client dont le fichier htaccess faisait … 8 Mo
    Oui oui.

    + de 100 000 lignes de redirections. Une agence “SEO” qui avait cru bien faire. Le fichier était tellement lourd qu’il était monté en cache sur deux frontaux.

    Et bien quand on l’a viré… on a pas gagné en perfs, ou quasi pas.

    Rien n’empêche de faire des redirections PHP/ASP 301 directement dans le code s’il y en a trop :)

  11. Pour un blog avec des milliers de pages ça devient vite très compliqué … Y a-t-il un risque à faire des 404/410/301 de façon massive (surtout sur des contenus pauvre en qualité par exemple très peu de mots) ?

  12. MA foi quand c’est possible de mettre de la 301 je suis plutot partisan, mais ce n’est pas possible tout le temps et comme tu le dis a un moment si vraiment on abuse on peut finir par faire ralentir le site (mais il en faut un paquet des 301 dans le Htaccess avant de voir le site laguer crois moi – note j’avais un méchant serveur dédié dans mon cas).

    Toutefois une jolie 404 perso avec quelques call to action bien senti ca peut etre une bonne soluce aussi

Les commentaires sont fermés.