En lisant plus en détails le document officiel fournit par Google concernant la mise en ligne de son prochain Page Rank pour les images, j’ai souhaité souligner quelques points importants, qui à mon sens, méritent d’être mis en avant.

2 nouveaux challenges pour Google :

  • Trouver les points communs aux images stockées sur le web pour pouvoir créer un algorithme universel.
  • Appliquer un mécanisme à ces points communs.

L’objectif est donc de trouver différentes méthodes qui consistent à appliquer un « ranking » à des visuels. La tâche est complexe, surtout lorsque l’on sait qu’un mot-clé tapé peut renvoyer non seulement des images totalement différentes mais aussi des thèmes d’images différents. Pour mieux comprendre, taper par exemple la requête « japon » dans Google Images. Vous verrez rapidement ce que je veux dire…

Mesurer la performance des visuels :

  • Etudier le comportement des internaute
  • Faire le lien entre la requête et les images les plus cliquées
  • Etudier la similarité entre les différents visuels (exemple les photos d’une voiture)
  • Analyser le linking entre les différentes images

Différencier et regrouper les visuels :

  • Analyser l’angle de vue
  • Analyser la localisation globale des images…
  • …pour les rassembler dans une famille similaire
  • Prendre en compte les meta date et le texte
  • Distinguer une image originale d’une (ou plusieurs) copies retouchées (un exemple bien parlant :) )

L’objectif d’un moteur de recherche est, rappelons le, de fournir les résultats les plus adéquat possible par rapport à une requête tapée. Je continuerai la synthèse du document très bientôt.