« Google – Our approach to content » est un article assez intéressant que j’ai pu lire sur le blog officiel de Google. Aujourd’hui, il est impossible de nier que Google ne possède pas une certaine maîtrise du contenu sur le web. Classé comme le moteur le plus utilisé au monde, c’est également celui qui indexe le plus de pages web. De plus, avec les différents services tels que Adsense ou Adwords, Google a réussi à faire le bonheur de certains…

Au sein de leur article, j’ai retenu les paragraphes suivants :

« Because we don’t own this content, over the years we’ve come up with three primary principles to ensure that we respect content owners and protect their rights:

  • we respect copyright;
  • we let owners choose whether we index their content in our products;
  • we try to bring benefit back to content owners by partnering with them. »

Si ces 3 points étaient respectés à la lettre, pourquoi y a-t-il eu un procès avec la presse belge ? Ceci dit, il s’agit d’un concept que Google souhaite, à l’avenir, respecter au mieux possible. De toute façon, il est pas possible d’assurer la diffusion d’une information de manière sécurisée. La base de cette insécurité repose tout simplement sur la gestion de l’indexation des pages web par le robot, souvent mise de côté par les webmasters, mais aussi la duplication de l’information d’une manière ou d’une autre.

Le plus simple pour ne pas dévoiler un contenu est donc de le rendre inacessible par les moteurs de recherches. Le seul souci est que si vous modifiez votre robot.txt « un peu trop tard », vous pouvez être certain que l’information « confidentielle » demeurera quelques années dans le cache de Google…