Archive for February, 2008
La long tail en référencement

Une représentation graphique du phénomène de long tail en référencement. Simple, mais efficace ! L’essentiel est de retenir que la focalisation sur un mot-clé unique est une grossière erreur pour le référencement d’un site. Plus vous serez précis mais varié dans votre vocabulaire sémantique, meilleures seront les conséquences sur le long terme… :)
Source : Elliance
3 comments7 raisons qui font que Google n’indexe pas votre site web
Lors du référencement d’un site web, il est vital de voir si celui-ci est bien pris en compte par les moteurs de recherche. De ce fait, il arrive parfois qu’aucune page d’un site n’apparaisse dans l’index Google. Avant de penser au blacklistage, il est important de vérifier quelques points :
Vous avez bloqué le spider dans votre fichier robots.txt :
Une erreur fréquente, qui se corrige rapidement mais dont l’impact est immédiat sur les moteurs de recherche. Si vous avez par erreur défini une règle de non-indexation de votre site dans ce fichier, n’espérez pas apparaître dans l’index de n’importe quel moteur de recherche. Si vous avez un fichier robots.txt dont le contenu ressemble à ce qui suit, vous risquez fortement de ne jamais voir votre site dans l’index Google.
user-agent : *
disallow : /
Votre serveur est beaucoup trop lent :
Google ne va pas pénaliser directement votre site dans ce cas. En fait, le problème va se poser si votre serveur ne peut répondre aux requêtes effectuées par le robot, afin que ce dernier puisse accéder à l’information. Si Google n’arrive pas à accéder à vos différentes pages, il ne va pas se mettre en pause et attendre que le serveur puisse lui réponde. Il va continuer sa route et aller crawler les autres sites concurrents alors que seules quelques pages de votre site auront été indexées. La faute ne revient pas ici à Google. Pour corriger cela, faites en sorte que votre serveur tienne la route, soit solide et puisse supporter les requêtes émises par les robots.
La navigation sur le site est problématique pour le moteur :
La navigation de votre site web est en flash ? 80% de vos liens sont cassés ? 90% des liens sont encodés dans une fonction javascript interminable ? Il va falloir penser à remettre à plat l’arborescence de votre site, toute en la rendant accessible pour le moteur. Vive le lien a href !
Vous êtes un spammeur :
Etes-vous le vilain canard ? Avez-vous un comportement vis-à-vis de votre site allant à l’encontre du professeur Google ? Vous cultivez les fermes de liens ou encore le contenu caché ? Il y a des chances pour Google s’en soit aperçu et ait décidé de classer votre site dans la rubrique des spammeurs. La solution ? Soyez honnête envers le moteur, effacez toutes les techniques à la “black hat” et faite auprès de Google une demande reconsidération (Google Webmastertools dispose du formulaire de contact). Encore une fois, il est possible de mixer design/validité w3C/recommandations référencement.
Votre site plante et vous êtes abonné aux erreurs 500 :
Si votre site repose sur un serveur instable, fabriqué avec des restes informatiques, il y a des chances pour que vous soyez un abonné des erreurs 500. Malheureusement, Google n’est pas trop fan de l’erreur 500. Si le problème revient très souvent, il finira par ne plus considérer votre site à cause de son état trop instable.
Vous avez un script javascript empoisonné :
Il s’agit d’un cas rare mais existant. Vous avez fait un magnifique site en prenant soin de suivre la plupart des recommandations en référencement (url rewriting, netlinking, balises des pages, titles différentes…) mais étrangement, aucune page de votre site n’est indexée sur les moteurs de recherche. Il se peut que vous ayez installé pour une quelconque raison un javascript en haut de votre page d’accueil (comme par exemple pour afficher le site dans la langue de votre navigateur). Malheureusement, les moteurs de recherche peinent à lire le javascript et lorsqu’ils sont bloqués, il s’arrêtent. De ce fait, impossible de crawler tout ce qui se situe après votre script (à savoir la page, le menu, les autres pages…).
Vous avez récupéré un nom de domaine avec un passé lourd :
Enfin ! Le nom de domaine que vous attendiez depuis des mois est disponibles, l’ancien propriétaire ne l’ayant pas racheté. Vous vous jetez dessus et mettez en ligne votre site web. Ce que le registar a oublié de vous dire, c’est que ce nom de domaine a été sujet de blacklistage avant votre rachat et Google ne souhaite plus jamais en entendre parler. Dans ce cas, la situation est plus compliquée. Vous devez être capable de déterminer ce qui a pu provoquer la pénalisation, en essayant par exemple de rentrer en contact avec l’ancien propriétaire… Dans tous les cas, il va y avoir du boulot car les vices cachés sont nombreux lors d’un blacklistage. Bien entendu, une fois les erreurs réparées, il faudra penser à faire une demande auprès de Google pour reconsidérer votre site.
Edit : dès la mise en ligne de votre nouveau site, il est nécessaire d’avoir au moins un lien pointant vers ce dernier afin que Google et les autres moteurs puissent le détecter naturellement. Sinon, vous resterez orphelin sur le web et aucune page ne sera indexée. Quant à la soumission manuelle Google, cette dernière n’est pas la solution que je recommande. Demandez à vos ami(e)s d’écrire un article sur votre site ou plus simple, de faire un lien. Les “sans amis” pourront toujours se rabbattre sur les annuaires de type Dmoz (sans en abuser).
18 commentsSuperCook : le moteur et guide des recettes de cuisine
SuperCook est un moteur de recherche thématique se focalisant sur la recherche de cuisine à partir d’ingrédients disponibles.
Le principe est simple : vous ajoutez les ingrédients que vous possédez dans un espace “cuisine” (un bloc d’affichage) et le moteur vous affiche en temps réel les recette disponibles. Un système d’auto completing vous accompagne pour vous aider à lister vos ingrédients.
En rentrant au fur et à mesure les ingrédients disponibles, les recettes disponibles s’affichent en temps réel et SuperCook vous indique également le nombre total de recettes de cuisine réalisables à partir des ingrédients sélectionnés.
Autre avantage qui renforce la position de guide de l’outil : les recettes pour lesquels un seul ingrédient est manquant sont également affichées, avec en dessous l’ingrédient nécessaire à rajouter dans votre cuisine. Un simple clic et hop, il s’ajoute dans votre bloc. Il est également possible de retirer des ingrédients de son espace.
En dessous de votre bloc de cuisine s’affiche un bloc avec un ensemble d’ingrédients que l’outil vous recommande. Ce bloc se met à jour en fonction des ingrédients rajoutés dans votre liste. Cet accompagnement supplémentaire a pour vocation d’enrichir le nombre de recettes affichées, mais aussi de peaufiner les recette déjà disponibles.
Enfin, il est possible de mettre en surbrillance un ingrédient au choix de votre liste, afin d’afficher les recettes davantage orientées vers cet ingrédient. Pratique si l’on possède un ingrédient en très grande quantité dans sa cuisine par exemple.
Visualiser la démo de SuperCook.
Il ne vous reste plus qu’à vider votre cuisine pour préparer de bons petits plats… :)
1 commentGoogle dans les pages d’erreur 404 de votre site web
Google s’incruste dans votre site web ?
Depuis la dernière version de la Google Toolbar, un nouveau changement a fait réagir pas mal de monde concernant Google et les pages 404. Au final, oui Google s’incruste dans vos pages d’erreur 404 de la manière qui suit :

Cependant, 2 conditions doivent être remplis pour “visualiser Google dans votre site”:
- vous devez posséder la Google Toolbar en version 5 sur votre navigateur.
- votre site doit avoir une page d’erreur 404 qui pèse moins de “512″ octets, ce qui est vraiment léger.
Par l’introduction de ces changements, je ne peux que vous recommander davantage la création et la mise en ligne d’une page 404 personnalisée, propre à votre site.
En outre, si l’on regarde plus attentivement la capture, on est en droit de penser qu’il s’agit d’un cadeau empoisonné. Si, en effet, cette page semble plus propre qu’une page blanche, notamment avec des liens pour rediriger l’internaute vers la home ou un sous-domaine d’un site, la réalité me semble totalement différente dans la pratique. En effet, lorsque je vois un logo Google, ainsi qu’un champ texte avec un bouton de recherche, il y a de fortes chances de maximiser les risques de voir l’internaute quitter rapidement votre site…grâce à Google !
Nous autres, humains, avons tellement de réflexes qu’ils nous arrivent parfois de faire les choses sans nous en rendre compte… :)
Mais avec un peu de recul, c’est davantage Google qui ressort dans ces nouvelles pages 404 et non votre site. A vous de changer cela en ayant une belle page d’erreur 404 !
3 commentsRedZee Search : le nouveau moteur de recherche visuel

Redzee.com est un moteur de recherche à caractère visuel uniquement. Ici, pas de texte mais seulement des résultats sous formes de vignettes dont la naviguation s’inspire de celle d’Itunes. La page d’accueil se veut déjà être très visuelle et animée, contrairement aux autres moteurs de recherche classiques !

Le nom de l’url, la méta description au centre et c’est tout…
La technologie derrière Redzee permet d’afficher par défaut jusqu’à 100 résultats sous forme de vignettes, contrairement au 10 résultats proposés par défaut sous Google. La navigation s’effectue, quant à elle, par simple mouvement de souris. Restez appuyé sur le clic gauche et bougez à droite ou à gauche pour faire défiler les résultats. Lorsqu’un site vous plaît, double cliquez dessus pour l’afficher en plein écran.
“Ever heard the proverb “A picture is worth a thousand words?” The idea that complex stories can be told with just a single still image, or that an image can replace huge amounts of text? Introducing Patent Pending Search 2.0.”
“We believe pictures are worth a thousand words and we’re bringing that philosophy to our search engine,” says John Stewart, president of RedZee Search. “Visuals make it so much easier to see what you like rather than read what you like.”
Si l’interface est encore loin d’être parfaitement fonctionnelle (quelques bugs sous IE et certaines versions de Firefox), je reste toujours agréablement surpris par l’originalité des interfaces des outils de recherche visuels.
4 commentsStandards W3C : Google, pas si intelligent que ça ?
C’est difficile à croire pour un moteur qui s’est développé à une vitesse fulgurante, mais Google possède encore de nombreux points faibles en ce qui concerne son suivi des évolutions dans les standards W3C. L’exemple parfait concerne la visibilité des contenus. En effet, Google a tendance à pénaliser les pages ayant du texte caché. Pour cela, il sait détecter les différents trucs CSS pour cacher du texte, même proprement. Et en règle général, il faut s’attendre à de lourdes sanctions (blacklistage de la page).
Malgré les abus, les gens honnêtes existent !
Seulement, tout le monde ne cache pas du texte pour tromper les moteurs de recherche. D’un point de vue design, il est parfois préférable de ne pas afficher ouvertement certains titres mais de les rendre invisible via un style CSS (indentation du texte à -200), en gardant un code propre valide. Cela permet ainsi de ne pas détruire un design en conservant la lecture d’une page web par des malvoyants par exemple. De ce fait, le contenu reste visible, mais hors du champs de visualisation de l’internaute. Malgré tout ce que j’ai pu lire sur le web, ce système reste encore dangereux pour le référencement d’un site web. Certains sites ont de la chance de passer au travers des filets de Google mais celui-ci annonce officiellement sur son guide pour les webmasters que les contenus cachés sont sujets à de lourdes pénalités, peu importe leur but.
Ce débat entre webmasters et référenceurs revient de plus en plus souvent, le référencement prenant enfin une grande importance dans la majorités des acteurs du web.
Une solution miracle ? Pas pour le moment !
Ceci étant dit, que faire ? Envoyer une lettre à Google ? Il y a peu de chances pour qu’elle soit prise en compte. Espérer que Google revoit son algorithme pour prendre en compte cette possibilité ? Je l’espère de tout coeur. Il serait temps que Google sache garder une certaine tolérance en ce qui concerne le texte caché dans une page. Il y a tout de même une différence entre avoir une soupe de mots-clés, un texte de 1000 caractères cachés et avoir 3 ou 4 titres propres dans des balises h1 et h2, invisibles seulement par pur souci visuel…
A ce jour, le problème n’est pas résolu et avec 90% des recherches effecutées sur Google en France, je ne peux que recommander aux webmasters de favoriser le respect des standards W3c, tout en prenant en compte les recommandations de Google, sous peine de rencontrer quelques soucis pour l’indexation de leur site…
13 commentsRéférencement : savoir gérer la transition vers le HTML 5
Le W3C a publié une première ébauche déjà bien fournie sur les spécifications du HTML 5. De ce fait, il est temps pour les moteurs de commencer à analyser les différents changements dans le code et de savoir, peu à peu, les prendre en compte. La prise en compte totale risque, à mon avis, de prendre un certains temps. En revanche, l’implémentation du HTML 5 n’est pas prévue avant 1 an ou 2 (d’après ce que j’ai pu entendre aux conférences du Parisweb 2007).
Vous trouverez une liste (traduite en française) des nouvelles balises HTML 5 sur Webrankinfo avec leur descriptif. Comme vous pourrez le constater, HTML 5 va permettre de simplifier grandement les mises en page !
2 commentsAuthorstream : présenter et partager ses powerpoint en ligne
![]()
Partager et présenter ses powerpoint en ligne : voilà ce qu’est capable de faire gratuitement le service Authorstream.
Lors de l’utilisation, la première impression est la ressemblance frappante avec l’interface de Youtube. Upload rapide, possibiliter de noter le powerpoint, de déposer des commentaires et de trouver les présentations en relation avec celle que l’on visualise. Il est également possible de visualiser la présentation en plein écran.
Il est possible d’effectuer une recherche à partir de différents critères :
- Auteur : affiche toutes les présentations ppt d’un même auteur.
- Catégorie : sélectionner le ppt disponibles depuis une liste de catégories (éducation, science, sports, célébrités…).
- Tag : chaque ppt est associé à un ou plusieurs tags personnalisés.
- Période : afficher toutes les présentations de la semaine ou du mois en cours.
Rien de plus facile que de suivre l’évolution des mises à jour des fichiers. Un flux rss est disponible pour la recherche par auteur et catégorie. Enfin, dernier bon point, il est possible de rendre privé certains Powerpoint et de n’autoriser qu’un certain nombre de personnes à les visualiser.Après quelques tests, je dois dire que j’ai été surpris par la simplicité et l’efficacité du site.
Pour le moment, je n’ai pas mis de présentations professionnelles mais vous trouverez tout de même un powerpoint uploadé par ma personne :)
1 comment



