Cas pratique SEO : microformats et les limites du tag canonical.

Je suis tombé sur un cas SEO un peu particulier que j’aimerais partager avec vous. Chers confrères, n’hésitez pas à me donner votre avis sur la question car je dois avouer que cette fois-ci, Google m’a pas mal surpris. Il s’agit de l’un des sites pour lesquels je travaille chez Transcontinental et ô joie, j’ai été autorisé à communiquer son nom avec vous (de toute façon, je ne vois pas en quoi c’est gênant vu que tout se sait tellement facilement).

Octobre 2010, les templates du site Recettes.qc.ca ont été modifiés de manière à intégrer proprement les microformats. Fin novembre, j’ai pu découvrir avec joie que les microformats avaient été appliqués dans les résultats de recherche Google.ca… Whouhou !

J’ai donc considéré ce point comme étant réglé et je pouvais passer à la suite, optimisations diverses, nouvelles stratégies de contenus, linking… Bref, autre chose !

Tout allait bien jusqu’à la fin août 2011 ou je me suis rendu compte qu’étrangement, l’aspect microformat avait disparu des résultats. Les changements se sont effectués pendant mes vacances (merci Google) et je n’ai pu voir le résultats qu’après coup.

J’analyse l’évolution de mon trafic naturel, je fais un compte-rendu détaillé de mon positionnement et là, tout va bien. Rien n’a changé, le trafic naturel est toujours aussi bon et progresse gentiment. Bref, il s’agit seulement d’une altération visuelle (et c’est toujours le cas aujourd’hui).

S’en suit alors un ensemble de vérification pour voir toutes les modifications qui ont été apportées au site. Après une analyse méthodique, la réponse est… rien ! En tout cas, rien qui aurait pu altérer ces résultats. Le template est toujours aussi propre, et il n’ y a pas d’erreurs dans la déclaration des microformats (exemple).

J’ai eu beau chercher, étrangement, je n’ai rien trouvé d’inquiétant. Pas de changement au niveau des perfs, pas de réorganisation de structure, le rare duplicate content présent sur le site n’avait pas bougé… Bref rien de neuf !

Et c’est un peu plus tard que j’ai vu que la version dupliquée de nos contenus chez notre partenaire, elle, ressortait toujours avec les microformats ! Surpris, je regarde cela de plus près et là non plus, rien n’a changé : leur positionnement naturel est toujours aussi pourrie sur les duplications et bien sur, les balises canonical tags sont toujours présentes et bien intégrées. Et pourtant, Google a choisi de garder l’affichage avec microformats chez le partenaire… Et non sur le site original ! Vous pouvez voir la liste des résultats.

Si Google avait déjà perdu pas mal en crédibilité à mes yeux, là, c’est un sérieux coup de massue qui s’ajoute sur cette crédibilité même. A quoi ça sert de mettre un canonical tag si Google n’est toujours pas fichue de considérer la bonne version de notre contenu… La prochaine question est « que faire » ?

A ce stade, à part régler les quelques problèmes de duplicate content sur le site (qui n’ont jamais rien perturbé et surtout qui n’ont pas de rapport avec le problème actuel) et refaire une demande de considération de microformats pour le site original, il n’y a pas grand chose de magique à envisager.

De ce fait, si vous avez pris le temps de lire mon étrange expérience, je serais curieux d’avoir votre avis sur la question.

Ce genre de soucis vous est-il déjà arrivé ? Avez-vous d’autres idées à me suggérer pour retrouver une situation normale ? Car pour le moment, je pense surtout que Google est légèrement parti en cacahuètes sur cette histoire.

Note : l’objectif de ce post est de partager cette drôle d’expérience avec vous et avoir votre retour. Je sais d’avance qu’il y a toujours matière d’optimisations seo sur le site de Recettes,  mais l’interrogation n’est pas là :). Un grand merci d’avance pour votre réaction.

24 réflexions au sujet de “Cas pratique SEO : microformats et les limites du tag canonical.”

  1. Ton étonnement correspondrait à la venue de Panda.

    Tu as bien fait de mettre l’exemple, le contenu dupliqué est un sous domaine de MSN qui n’est pas la plus petite autorité que Google connait.

    On se retrouve au même constat qu’au début de Panda, l’original ne veut rien dire, seul l’autorité est importante, des exemples ici :
    http://www.seomoz.org/blog/postpanda-your-original-content-is-being-outranked-by-scrapers-amp-partners

    Je vois que tu n’es pas passé non plus sous schema.org, tu as bien fait car même si Google le met en avant, il ne l’utilise pas pour ses snippets (un comble…)

    C’est une piste et je me gourres peut être, je trouve juste que la coincidence est étrange…

    P.S : Très épuré ce nouveau template ^^

  2. Alors celle là elle est pas mal quand même :)

    Je suis désolé d’avance car je ne vois pas non plus comment tu pourrais faire, à par en effet refaire une demande pour la prise en compte des micro-formats sur le site original.

    Par contre, j’ai une question sur les micro-formats. Les as-tu déjà utiliser pour autre chose que des sites de cuisines et avec quels résultats par rapport aux efforts que demandent leur mise en place?

  3. Et la popularité du site MSN ne serait pas un début de réponse?

    Ainsi Google ne suivrait les canonical que si le site est moins populaire que celui qui est la source du contenu (celui ciblé par la canonical)?

  4. Votre cas pratique est intéressant car j’ai constaté le même phénomène…chez un de mes concurrents. En effet, fin aout j’ai vu que son site apparaissait dans google avec des petites étoiles bien séduisantes sur certaines de ses pages. J’ai donc décidé de me mettre aussi aux microformats pour obtenir (si google le veut bien) le même genre de résultat. Et paf, depuis le 10 septembre environ, les étoiles ne sont plus affichées dans google pour ce concurrent. Pourtant, son site ne semble pas avoir été modifié de manière significative.
    Du coup, je ne pense pas que ce problème ait un rapport avec la balise « canonical »…

  5. Je ne t’apporte pas de solution, désolé, juste une expérience + ressenti.

    J’ai toujours trouvé l’application des microformats très aléatoire dans la SERP. Ca passe un mois, puis plus le mois suivant sans aucune raison visible.

    Ensuite, le fait qu’ils soient encore appliqués chez ton partenaire ne m’étonne même plus. Quand on voit comment Google patouille dans les dupliqués. Je me pose toujours autant de questions sur la canonical inter-domaine. A croire qu’elle est appliquée à pile ou face.

    J’en suis venu à proposer à mes clients e-commerce de rédiger un titre et une description de leur produit pour eux, et un autre jet pour les sites externes. Mais j’admets que ce n’est pas évident pour des recettes de cuisine.

  6. @Vincent : j’avais vu cet article mais à ce moment-là, je ne vois vraiment pas pourquoi Google a crée les canonical. A ce train là, j’ai l’impression qu’il va falloir revenir aux sources, à savoir un gros noindex chez le partenaire (je doute qu’il accepte, vous connaissez les partenaires…).

    @Antoine : justement si, la considération de la plateforme msn est un début de réponse. Néanmoins, il faut savoir qu’au Québec, le sites Recettes.qc.ca a énormément de popularité (largement au niveau d’un marmiton en France) donc ce changement soudain m’a choqué.

    @Greg : j’ai déjà appliqué des microformats sur des vidéos, ça s’est bien passé mais ça a pris plus de 4 mois avant que je vois les effets en ligne.

    @Sylvain : en fait, j’ai souvent eu de bons retours pour les microformats. Quand c’était fait proprement, ça finissait par s’afficher dans les SERP et ça restait. Là pour le coup, c’est resté sans broncher pendant plus de 8 mois et après, c’est le partenaire qui en profite. Peut-être que c’est Panda, peut-être que c’est autre chose… Mais je trouve que c’est vraiment du gros n’importe quoi :).

    Pour la canonical interdomaine, c’est clair que je commence sérieusement à me poser la question sur sa réelle pertinence.

    Comme tu le dis, dur d’avoir une description différente pour les recettes… A part insérer une violente meta robot noindex,follow sur leur contenu, je ne vois pas trop quoi faire. Ceci étant dit, lors de la demande auprès de Google, j’ai détaillé tout mon problème en anglais… On ne sait jamais, si vous priez tous avec moi, peut-être qu’ils vont me répondre :).

  7. @tous : Merci pour votre retour rapide.

    @ux autres : n’hésitez pas à commenter, c’est toujours bon de voir que l’on est pas le seul à rencontrer des cas tordus de ce genre…

  8. Je pense que le fait que le contenu dupliqué soit sur un sous-domaine de MSN te fait réellement défaut … même avec une canonical …

    Sinon j’ai remarqué comme Sylvain que l’affichage des micro-formats dans les résultats de Google est assez aléatoire, j’ai eu un cas où ils sont réapparus tous seuls au bout de quelques semaines sans vraiment comprendre pourquoi (pas de modifs majeures du site …)

  9. J’ai bien peur qu’MSN te bouffe tes rankings pour encore un moment – GG n’a rien résolu en ce qui concerne le duplicate et ce n’est pas la mise en place de canonical qui changera grand chose – MSN a plus d’authorité que ton site donc …

  10. Je n’ai jamais voulu utiliser cette balise qui n’est qu’une rustine…
    Pour ce type de partenariat, je recommande un noindex + blocage via le robots.txt.

  11. Mon expérience avec le tag canonical se limite à deux cas particuliers:

    1er cas: un site et ses sous-domaines et ça fonctionnait très bien.

    2eme cas: un site e-commerce dont les pages étaient naturellement dupliquées (a cause du cms) mais j’avais en plus verrouillé en bloquant les url duppliqués par des disallow dans le robots.txt.

    De mon coté mes impressions sur ton cas sont plutôt positifs et on peut mieux cerner le problème : Pas de perte de trafic.

    La problématique du tag canonical n’est pas en cause.
    Toutefois en interrogeant le Rich Snippets Testing Tool j’obtiens: Extracted Author for this page Page does not contain authorship information

    Il y a une piste à explorer.

    Pour ce qui est des micro-formats, ton intervention était en Octobre 2010 et Shema a été déployé cet été.

    Je pense que des tests sur quelques pages avec la nouvelle norme devrait éclaircir les choses.

  12. Voilà ce que je peux lire aussi à propos de Shema :

    3) We’ll continue to support our existing rich snippets markup formats.
    If you’ve already done markup on your pages using microformats or RDFa, we’ll continue to support it. One caveat to watch out for: while it’s OK to use the new schema.org markup or continue to use existing microformats or RDFa markup, you should avoid mixing the formats together on the same web page, as this can confuse our parsers.

    Est-ce vraiment nécessaire de revoir cela sachant que j’ai un autre site de cuisine pour lesquels il n’y a aucun problème avec les microformats… ? Par contre, seule une petite partie du contenu est dupliquée chez le partenaire, pas toute les recettes.

  13. j’ai un problème identique sur un site que je viens de reprendre. AMHA la canonical cross domain fonctionne mal surtout lorsque différence de notoriété. Très loin de la quasi 301 annoncée !
    Pour les microformats ils ont disparu aussi des SERP, je pense convertir en microdata pour voir si GG les fera réapparaître, car c’est un avantage pour le CTR

  14. Le Trust Rank MSN est plus fort que le tag canonical, j’ai constaté le même problème avec un client e-commerçant VS comparateur de prix (Panda étant censé lutter contre les comparateurs de prix !!)

  15. Non ne passe surtout pas sur schema, c’est le meilleur moyen de perdre tes snippets, pour l’instant ne fais rien.
    J’avais pas capté qu’il y avait un canonical sur les recettes, toutefois mon précédent commentaire a encore son sens. J’ai l’impression que ton canonical n’est absolument pas pris en compte par Google.
    Je t’explique pourquoi j’en suis certain : les signaux sociaux sont censés être transférés dès que tu ajoutes un canonical. Mon exemple vaut 1000 mots : http://www.jambonbuzz.com/en-vrac/juste-un-test-2011-06-14
    (je te laisse regarder le nombre de tweet ainsi que le canonical)
    Ici ce n’est pas du tout le cas ou du moins ce n’est pas le cas car tu es en duplicate interne et ton concurrent ne t’aide pas à pointer vers la bonne page.

    Prenons cet exemple :
    http://recettes.styledevie.ca.msn.com/recettes/recette.php?id=1752&rdj=&pub=
    Le canonical va vers cette page :
    http://www.recettes.qc.ca/recettes/recette.php?id=1752&rdj=&pub=
    alors que la page référencé est celle-ci :
    http://www.recettes.qc.ca/recettes/recette.php?id=1752

    Bref, si tu veux avancer, demande à ton partenaire de pointer vers la bonne URL. S’il ne veut pas, fait toi même un canonical vers les URLs sans paramètre (ça ne peut être que bien).
    Le jour où tu verras les mêmes signaux sociaux sur msn que sur ton site, ça veut dire que le canonical servira à quelque chose. Pour l’instant Google doit l’ignorer car il considère que la page de destination est peu utile à ses internautes.

    J’espère que j’étais assez clair, j’ai mélangé deux notions car j’ai changé de piste en cours d’analyse ^^

  16. Les URLs de « recettes.styledevie.ca.msn.com » présentes dans les résultats de Google prennent toutes de la 302 avant d’arriver sur les pages comportant la canonical.

    Coincidence…

    … je ne crois pas ^^

  17. Applications des micro formats aléatoires, duplicate contents mal gérés privilégiant le trust rank à la balise rel canonical… La réponse d’Aurélien est certainement la meilleure :)

  18. Merci pour ses réponses. Bon, déjà ça me rassure, je ne suis pas le seul à penser que le canonical tag, niveau efficacité, ça ne vaut pas grand chose.

    Et la solution que je craignais le plus est sortie d’elle-même. Pas le choix que de mettre du noindex sur les pages dupliquées. Par contre, je doute qu’ils acceptent de faire ça chez MSN… Youhouu ! En gros, à moins de partager mon contenu avec une petite entité pas très connu, le canonical ne sert à rien !

    @Vincent : je ne compte pas passer par schéma, Google m’a déjà prouvé que ma modification de template était la bonne pour les microformats (et c’est toujours le cas car j’ai un autre site de recettes qui affichent toujours de beaux résultats).

  19. Bonjour, même problème constaté sur mon site http://www.justacote.com. Depuis la mi-août, Google ne prend plus en compte les microformats dans les SERP alors que nous n’avons rien modifié et que ça fonctionnait très bien auparavant. Nous n’utilisons pas la balise canonical sur les pages concernées. Je ne pense pas que ce soit lié.

  20. MAJ :

    – Les quelques duplicates content sont en train de disparaître du site (vive les 301).
    – On a demandé au partenaire du mettre une bonne vieille balise meta robot noindex nofollow (désolé mais je préfère faire les choses de manière radicale).

    On va bien voir la suite… S’ils refusent, adieu le partenariat !

  21. J’aimerai comprendre pourquoi les autres commentateurs indiquent de préférer microformats aux mcirodata de shéma.org?
    Est-ce toujours d’actualité?
    Quelle en est la raison?

  22. J’utilise personnellement schema.org.
    Le site de Photographie mis en ligne le 04 Mars 2012 bénéficie depuis le 18 Mars 2012 des richsnippets à l’image de ce résultat pour la recherche photo graine d’érable à sucre

    J’ai pu constater le comportement suivant :
    Google n’affiche pas les étoiles s’il y a pas d’avis. Il en faut au moins 1 pour bénéficier de l’affichage.
    Il n’utilise pas tous les rich snippets disponibles : les breadcrumbs pour cette même page de résultats ne s’affichent pas (ils sont pourtant bien présent dans le code source de la page dans un h6)

    J’ai également réussi à faire supprimer l’affichage des rich snippets d’un autre de mes sites de test SEO sur un autre domaine d’activité grâce au formulaire anti-spam de Google en donnant comme excuse une utilisation abusive… Négative SEO ?

    Concernant le cas présent de Ramenos, Google aurait très bien pu décider de privilégier les schema plutôt que d’autres microformats, ainsi il pourrait abandonner le support de l’un d’entre eux afin de privilégier la solution schema… La diversité ne serait pas favorable à l’efficacité de l’interprétation ? Les formats ne serait-il pas comparables ?

  23. MAJ pour tous : le problème est aujourd’hui réglé. La duplication de contenu fournie au partenaire ne contient aucun tag pour l’affichage en rich snippet.

    En revanche, Google nous a clairement expliqué pourquoi les résultats Recettes.qc.ca n’apparaissaient plus en microformats (c’est qu’il est devenu tatillon le Google).

Laisser un commentaire