Google exploite à nouveau les flus RSS pour crawler les contenus

Récemment, le blog officiel Google a annoncé que le moteur exploitait à nouveau les flux RSS pour découvrir de nouveaux contenus. Ayant pour objectif de démultiplier les moyens d’accès aux sources, les flux RSS sont donc exploités. En effet, en 2007, Google avait annoncé qu’il n’indexait plus les flux RSS.

L’avantage d’exploiter les flux RSS est de pouvoir indexer plus rapidement de l’actualité « fraîche » dans sa base de données. J’ai presque envie de dire que l’exploitation des flux RSS doit être intimement liée au filtrage des résultats par le temps (voir la barre « Show Options » dans Google US).

Pour ceux et celles qui ne préfèrent pas indexer leur flux RSS, rien ne vous empêche de rajouter une règle dans votre fichier robots.txt. Encore une fois, tout dépend de votre site et de vos objectifs.

Enfin, si le souci de la duplication de contenus peut se poser (par exemple pour un blog), je pense (et j’espère) que Google continue d’ignorer si nécessaire le contenu de ces flux…

1 réflexion au sujet de « Google exploite à nouveau les flus RSS pour crawler les contenus »

  1. Bizarre Google présente ça comme si le fait de suivre les liens des flux RSS était nouveau…

Laisser un commentaire