Title : n’oubliez pas d’exclure les stopwords

stop_words

Lorsque l’on procède à la réalisation du contenu éditorial de son site et qu’on souhaite remplir correctement les principales balises d’en-têtes, on a souvent tendance à oublier les stopwords. Je vous propose de faire un rappel rapide sur le sujet.

Stopwords, Kesako ?

Les stopwords sont des mots qui sont filtrés par les moteurs de recherches (dont Google) lors du passage du robots sur les pages. Ainsi, s’il est souvent recommandé de ne pas dépasser une soixantaine de caractères pour la balise Title par exemple, il s’agit de soixante caractères pour les mots qui ne seront pas ignorés. En effet, soucieux de l’importance des mots-clés décisifs, les principaux moteurs ne tiennent ainsi pas compte de certains mots-clés.

Imaginons que j’ai rédigé la Meta Title suivante pour un article :

Google – La référence des moteurs de recherche sur Internet

Si l’on se met à la place du moteur de recherche, les mots en rouge ne seront pas pris en compte et le moteur accordera ainsi de la considération aux termes suivants :

Google – référence moteurs recherche internet

De ce fait, même si, à l’affichage dans les résultats des moteurs de recherche, le dernier mot du Title n’apparaît pas à cause des stopwords qui sont présents en grand nombre, Google le prendra néanmoins en compte (en tout cas, c’est ce que j’ai remarqué en faisant quelques tests). Cependant, si les stopwords sont ignorés, Google les prend en compte pour mesurer la distance entre les différents mots-clés. Si, par exemple, vous décidez de répéter 2 fois un même mot-clé dans votre Title, le moteur de recherche pourra, à l’aide des stopwords, mesurer la distance entre les deux occurences… Mais bon, vous n’êtes pas des spammeurs, n’est-ce pas ?

18 réflexions au sujet de “Title : n’oubliez pas d’exclure les stopwords”

  1. Je suis un peu sceptique… Quelques remarques qui n’engagent que moi :

    – Google n’ignore plus complètement les stop words. D’ailleurs avant Google affichait un message du genre “‘de’ a été ignoré”, et ceci a été retiré
    – Qui a dit qu’il fallait 60 caractères et pas un de plus ou de moins ? Google prend en compte plusieurs centaines de caractères dans la balise title (je l’ai testé) ! Si on parle souvent de 60 caractères, c’est pour que le titre soit entièrement visible dans les pages de résultats, car Google tronque aux alentours des 60-65 caractères.
    – Un titre auquel on retire les stop words apparait comme étant moins naturel, ce qui peut faire chuter le taux de clics dans les pages de résultats

    Et une petite dernière : il n’existe pas de balise meta title, la balise title n’est pas une balise meta

  2. Bonjour Olivier,

    Je me suis mal exprimé : je voulais dire une soixantaine de caractères. Personnellement, je ne vois pas l’intérêt de mettre une balise Title avec une quinzaine de mots-clés. Cela réduit, à mon sens, la pertinence sur la prise en compte de chacun des mots. Mais encore une fois, ce n’est que mon avis.

    Quand je parlais d’exclure les stopwords, je ne voulais pas dire les supprimer visuellement : nous sommes d’accord, il est important de parler et rédiger un bon français. Mais il n’est pas nécessaire de les compter dans les mots à afficher.

    Quant au mot “Meta”, autant pour moi, il s’agit d’une mauvaise habitude… Mais dans l’absolu, il est juste qu’il ne s’agit pas d’une balise Meta mais une balise d’en-tête. :)

  3. Je suis d’accord sur les points repris par Olivier. Aujourd’hui ces “stop words” se doivent dans une certaine limite de figurer dans les titres afin d’avoir une optimisation naturelle

  4. Encore une fois, je crois qu’il y a mauvaise compréhension sur le titre : je n’ai pas dit d’écrire en langage primaire, je dis juste qu’il n’est pas nécessaire de les compter lorsque vous écrivez votre Title… :)

  5. > Nicolas : Je propose exactement la même liste de mots dans mon post…

    > Pour le bug : tout est corrigé, encore désolé à tous !

  6. Je suis limite hors sujet (?) mais j’espère pas totalement…
    Dans la meta keywords de mes sites
    (www.trampofun.fr en Joomla pour le conseil et http://www.mon-trampoline.com en oxatis pour la boutique)
    j’ai tendance à répéter systématiquement le mot clef trampoline (un peu mono-centré comme garçon, mais j’ai de bonnes raisons…).

    Ce qui donne pour la balise mot clef:
    trampoline enfant
    trampoline filet
    trampoline enfant 3m

    “2 much buddy” sur le terme trampoline (me dirait un gars de la Caroline du Sud qu’a pas perdu le nord)…
    Ou
    Nickel chrome continu comme ça…

  7. Limite hors sujet oui mais ce n’est pas grave. J’ai plus envie de te dire “2 much buddy” et surtout, la balise Meta Keywords n’est plus vraiment exploitée donc ne perd pas ton temps dessus. Pour info, sur mes sites, je la laisse souvent vide ou à la limite je la remplis avec 2 ou 3 mots-clés max.

  8. Je ne pense pas qu’il soit utile de supprimer les stopwords. Google reconnait les stopwords et je dirais même : Que pense google quand une phrase n’a pas de stopwords ? => que cette phrase n’est pas destinée aux internautes.

  9. ok mais quand on conseille de se limiter à ~60 caractères, c’est surtout pour l’affichage dans les pages de résultats, on est bien d’accord ? Dans ce cas les stop words sont bien inclus et non exclus de ces 60 caractères…

  10. Quelques petites remarques suites aux différents commentaires :
    @Olivier Duffez et @ramenos: J’aime quand tout le monde dit “j’ai testé” mais on n’a pas de preuve concrète concernant l’environnement (site e-commerce, social, blog, institutionnel, etc… ) et le de certificat. Je suis un peu dans la même consternation de savoir si oui ou non je dois faire des phrases complète ou dois je me contenter d’une succession de tags ? Ayant eut une discussion avec Ramenos il y a peu il me semblait que le fait d’avoir des phrases complète améliorerai le référencement auprès de Google. Il me semble d’ailleurs que Google référence la phrase entière. Je n’ai pas testé sur un serveur perso mais tout de même lorsque je recherche quelque chose et que je n’ai pas envie de m’embêter je tape la phrase entière et il arrive qu’il trouve tous les mots avec les stopwords comme vous appelez cela. (mots de liaison).

    @fred: Ramenos à raison là dessus ;) Un peu bourrin comme méthode. “risky”

    @tous: en HS il serai très sérieux de la part des référenceur de se pencher sur une méthode de certifié les actions de test sur les moteurs de recherches. Certificat, environnement, comportement, actions menés, vidéos à l’appui pourquoi pas. Bref c’est une idée de projet.

  11. @loopion : le seul objectif de ce post est d’annoncer que Google n’octroie pas le même poids au stopwords. A mon sens il les ignore mais tout peut changer du jour au lendemain avec ce moteur.

    Pour les méthodes, certifier des aspects, je ne dis pas non. Mais ça veut dire les modifier en permanence à cause de l’évolution de l’algorithme des moteurs de recherche…

    En revanche, je suis tout à fait ok avec toi sur les tests. Il faudrait que je fasse des captures d’écrans ou que je prenne des notes lorsque je fais mes essais….

  12. OK je crois à vos tests mais cela n’empeche pas GG de faire des stats avec des stopwords, des s, des accents… dans GG Insight.
    ET il fait des progres car il reconnait les “-” depuis qqs semaines cependant que le keywords tools a toujours du mal à enregistrer les scores du mot “coffre-fort” (avec -). Et les apostrophes posent toujours un pb de reconnaissance aussi (remplacé par un blanc ou un anti-slash)

    Alors,dans un contexte concurrentiel, le stopword fait la différence s’il est inclut dans l’expression demandée. Enfin AMHA d’expérimentateur quotidien.

    Dernière remarque, le TITLE n’est pas une META puisque tout le monde le dit y compris wikipedia mais c’est vraiment stupide de le différencier à ce point.
    Un peu comme si on disait que la locomotive n’est pas dans le train (qu’elle traine).

    Bonne nuit
    David

  13. Un peut litigieux cet article tout de même. Merci à Olivier de l’avoir repris sur les points importants. Essayez d’être un peu plus précis dans vos articles, je pense qu’on se le doit quand on est éditeur de contenu, et surtout dans un domaine pointu où il n’y a pas de place pour l’approximatif.

  14. Ce sont des questionnements, intéressant en particulier, pour les pages d’accueils (ou grandes rubriques), il faut effectivement tenter de rentrer dans les 60 caractères pour rester esthétique dans Google, mais il faut aussi en profiter pour placer ses mots-clés, mais comme le rappelle Olivier Duffez, il faut aussi rester sexy pour l’internaute :)

    Pour de nombreuses pages on ne se posent pas vraiment la question, en effet, on reste souvent sur du Title = Titre, comme sur tont blog.

    D’ailleurs, si je peux me permettre, je ne suis pas sûre qu’il soit opportun d’ajouter “Ramenos” au début de tes titles, à mon avis tu n’as pas la notoriété qui peut le justifier :D

  15. Pour rebondir sur ton article Arnaud, on peut appliquer la technique de suppression des stopwords pour les url…

  16. Intéressant comme débat, dans l’url cela n’est pas intéressant de laisser les stop words, ça c’est certain. Maintenant, je lis partout qu’il faut absolument ne pas dépasser les 70 caractères dans le title (pour l’affichage dans les Serp’s et afin d’éviter de diluer la “puissance” des mots). Je ne suis pas forcément d’accord, j’ai eu plusieurs fois de bons résultats sur des titles de 90 caractères qui visaient plusieurs requêtes de longue traîne peu concurrentielles (volume de recherche de 500-700 par mois). Sans trop d’effort tu peux générer du trafic rapidement.

Laisser un commentaire