Archives 'Outils de recherche' Category
Google Doctype, le Wikipédia du Webmaster
Google vient de mettre en ligne Google Doctype, un wiki qui se veut être une encyclopédie sur tout ce qui touche aux standards du web : bonnes pratiques du HTML, CSS, Javascript, HTTP, sécurité web…
Google Doctype est un wiki dans le sens ou n’importe qui peut éditer le contenu existant, à condition néanmoins de posséder un compte Gmail.
Par cette mise en ligne, on comprend rapidement que Google souhaite monter un Wikipédia pour les créateurs de sites ou d’applicatifs en suite. Petit plus : par ce geste, Google encourage vivement les utilisateurs à suivre et respecteur au maximum les standards du web lors de la création de projets en ligne.
Mais ce qui me fait le plus sourire, c’est la mise en ligne d’une telle documentation un jour après avoir lu une brève sur la répartition du trafic entre les différents moteurs de recherche que sont Google, Yahoo, Msn, Aol et… Wikipédia (près de 10% du trafic aux Etats-Unis). A mon avis, Google a certainement envie de piquer du trafic à Wikipédia pour le ramener sur Google Doctype… Reste à voir si cela suffira car Wikipédia a su imposer sa notoriété depuis de nombreuses années.
No commentsMoteur de recherche de photos en japonais : Viim
Malgré la langue japonaise, Viim est un moteur de recherche de photos très simple à utiliser. Une simple expression à rentrer (en anglais svp) :

Et une liste de résultat s’affiche sous la forme d’une succession de diapositives.

Sur la gauche, je vois un petit bouton “Turbo”. Intrigué j’appuie dessus et continue de visualiser mes résultats de recherche. Et là, c’est plutôt sympa ! Allez voir.
No commentsGoogle Page Rank pour les images : synthèse (2/2)
Ci-dessous la suite de la synthèse du document sur le Google Page Rank Images :
L’expérience utilisateur :
- Mixer le top 10 des images choisies par les programmeurs Google…
- …Avec le top 10 des images Google
- Objectif pour l’utilisateur : déterminer les images les plus pertinentes
- Examiner chaque image une par une parmi un groupe d’images (environ 3 par paquet)
Pour avoir des chiffres, 150 volontaires ont participé à l’expérience avec, pour chacun d’eux, un choix entre une cinquantaine de requêtes.
Affichage et analyse des résultats :
- 3 formes d’affichages (top 10, top 5, top 3)
- Logos, affiches et thumbmails font parti des images les moins pertinentes d’après les utilisateurs
- Mesure du taux de clics utilisateurs
- Résultats biaisés à cause de l’ordre d’affichage (une image de qualité médiocre mais pertinente en page 1 va recevoir plus de clics qu’une image de qualité et très pertinente en page 2)
- D’où l’intérêt de réaliser cet algorithme !
En conclusion, il apparaît évident qu’un système de Page Rank pour les images est nécessaire pour l’utilisateur (ça devait arriver un jour ou l’autre vu les absurdités que l’on rencontre dans Google Images). Si un algorithme va être mis en oeuvre (notamment en matière de similarité entre les images par exemple), Google parie énormément sur le comportement humain, les images étant une donnée très particulière.
J’ai repris, par synthèse, les principaux points du document. Si vous souhaitez en savoir plus sur ce nouvel algorithme, n’hésitez pas à le télécharger.
No commentsGoogle Page Rank pour les images : synthèse (1/2)
En lisant plus en détails le document officiel fournit par Google concernant la mise en ligne de son prochain Page Rank pour les images, j’ai souhaité souligner quelques points importants, qui à mon sens, méritent d’être mis en avant.
2 nouveaux challenges pour Google :
- Trouver les points communs aux images stockées sur le web pour pouvoir créer un algorithme universel.
- Appliquer un mécanisme à ces points communs.
L’objectif est donc de trouver différentes méthodes qui consistent à appliquer un “ranking” à des visuels. La tâche est complexe, surtout lorsque l’on sait qu’un mot-clé tapé peut renvoyer non seulement des images totalement différentes mais aussi des thèmes d’images différents. Pour mieux comprendre, taper par exemple la requête “japon” dans Google Images. Vous verrez rapidement ce que je veux dire…
Mesurer la performance des visuels :
- Etudier le comportement des internaute
- Faire le lien entre la requête et les images les plus cliquées
- Etudier la similarité entre les différents visuels (exemple les photos d’une voiture)
- Analyser le linking entre les différentes images
Différencier et regrouper les visuels :
- Analyser l’angle de vue
- Analyser la localisation globale des images…
- …pour les rassembler dans une famille similaire
- Prendre en compte les meta date et le texte
- Distinguer une image originale d’une (ou plusieurs) copies retouchées (un exemple bien parlant :) )
L’objectif d’un moteur de recherche est, rappelons le, de fournir les résultats les plus adéquat possible par rapport à une requête tapée. Je continuerai la synthèse du document très bientôt.
No commentsSearch Hacker : télécharger des fichiers mp3, torrent, avi, xml, iso, pdf…

Search Hacker FSE est un moteur de recherche de fichiers. Actuellement en version bêta, l’outil semble très prometteur. Si l’interface est déjà plutôt agréable à utiliser, les fonctionnalités sont déjà exhaustives pour une simple bêta.
Ainsi, lors de la recherche d’un “élément”, il est possible de lancer une recherche en sélectionnant des filtres qui s’avèrent, pour la plupart, fortement utiles (en gras les filtres qui me semblent les plus intéressants à utiliser) :
- Torrent : torrent
- Audio : mp3, wma, wav, oog, aac, ope.
- Video : avi, wmv, mov, flv, mpeg, divx, rm, srt, mp4.
- Document : txt, doc, pdf, xls, ppt, rtf, xml, chm.
- Image CD : iso, bin, nrg, cue, dmg.
- Archive : zip, rar, ace, rpm, exe, deb, bz2.
- Police : ttf.
- Image : jpeg, gif, png, psd, ai, fla, swf.
- Base de données : sql, mdb, db.
- Roms jeux vidéo : nes, nds, n64, rom, gba, ngp
Si je ne peux que prôner la mise en ligne d’un tel moteur de recherche, j’espère que Search Hacker aura un dossier béton d’un point de vue juridique. Bien que le moteur n’héberge pas de fichiers, les résultats de recherche affichent des accès directs au téléchargement des réponses proposées… Un peu limite pour certains filtres :-)
A noter également que le moteur a prévu de proposer les filtres suivants dans sa prochaine version :
- Mot de passe
- Emissions de télévision
- Actualités
- Shopping
- Livres en ligne
Google instaure un Page Rank pour les images
Lors d’une conférence au WWW2008 de Beijing, Google a présenté son modèle de Page Rank qui s’appliquerait à Google Images. L’objectif étant bien sur d’améliorer les résultats de recherche des images. Avec ce nouvel algorithme, Google devrait ainsi proposer de meilleurs résultats lors de la recherche d’images (ce n’est pas du luxe vu les mauaises surprises que l’on peut parfois rencontrer).
D’après un article du NYtimes qui aurait étudier la chose, nous aurions bien de nouveau un chiffre qui serait attribué à l’image en fonction de son “efficacité”.
Pour ceux qui veulent en savoir davantage sur cet algorithme, vous pouvez télécharger le rapport détaillé de Google sur l’algorithme du Page Rank Google Images.
1 comment
