Ceci est un document rĂ©digĂ© pour un client en juin/juillet 2007. Un grand merci Ă BĂ©atrice pour son assistance Ă©ditoriale! Si vous voulez l’imprimer et le lire tranquillement, je vous recommande de tĂ©lĂ©charger le PDF (6 pages). Ce document est distribuĂ© sous une licence Creative Commons by-nc-sa.
Introduction
On est souvent tentĂ© de mesurer le succĂšs d’un site internet par son placement dans les moteurs de recherche [1]. En effet, un bon placement dans les moteurs de recherche peut ĂȘtre un indicateur parmi dâautres du succĂšs d’un site. Malheureusement, le fonctionnement des moteurs de recherche en gĂ©nĂ©ral et du positionnement en particulier est difficile Ă comprendre et amĂšne souvent Ă avoir des attentes peu rĂ©alistes en la matiĂšre, en particulier l’exigence des rĂ©sultats prĂ©cis pour certains mots-clĂ©s donnĂ©s.
Le positionnement dans un moteur de recherche ne peut pas ĂȘtre contrĂŽlĂ© [2]. On peut l’influencer positivement en soignant certains aspects techniques ou rĂ©dactionnels du site, mais le facteur principal dans un bon placement demeurera inĂ©vitablement la qualitĂ© du contenu.
En fait, le placement dans les moteurs de recherche est une consĂ©quence de la popularitĂ© d’un site, et non sa cause. (MĂȘme si, bien entendu, un bon placement peut amener des visiteurs au site — mais un bon placement seul ne suffit pas.)
1. Comment fonctionne un moteur de recherche ?
1.1. Fonctionnement général
La fonction principale d’un moteur de recherche est de fournir Ă son utilisateur la liste des pages Internet correspondant aux mots-clĂ©s que celui-ci aura spĂ©cifiĂ©s. GĂ©nĂ©ralement [3], cela revient Ă fournir une liste de pages contenant ces mots-clĂ©s. Cela est en soi une opĂ©ration relativement simple. Ce qui est trĂšs complexe, par contre, c’est le classement de tous ces rĂ©sultats afin de mettre en tĂȘte de liste les plus pertinents. L’algorithme utilisĂ© par Google Ă cet effet est secret, et comprend une bonne centaine de variables. On saisit donc aisĂ©ment pourquoi il n’est pas possible de contrĂŽler sa position dans un moteur de recherche. D’ailleurs, si ça l’Ă©tait, ce positionnement perdrait tout son sens…
Le premier facteur qui va influencer le placement est bien entendu le contenu de la page : les mots-clĂ©s y apparaissent-ils? Sont-ils proches les uns des autres, ou bien Ă©loignĂ©s ? Apparaissent-ils une seule fois, ou bien plusieurs fois ? Apparaissent-ils dans le titre de la page, dans les divers titres qui organisent le contenu de celle-ci, dans le corps du texte, en gras, dans un lien, dans des citations, en haut de la page, en bas de la page… ?
Un autre facteur qui va avoir beaucoup d’influence sur “l’autoritĂ©” que Google accordera Ă un site Web est le nombre de liens entrants vers ce site. De plus, la provenance de ces liens a une importance : le “pagerank” (autoritĂ©) se calcule de façon circulaire. Logiquement, les liens provenant de sites dont l’autoritĂ© est dĂ©jĂ reconnue auront plus d’impact que des liens provenant de sites moins cotĂ©s (mais un grand nombre de liens provenant de sites peu cotĂ©s comptera Ă©galement…).
Le fait de dĂ©finir des “mots-clĂ©s” [4] dans les diffĂ©rentes pages du site Ă©tait trĂšs important pour le placement dans les moteurs de recherche Ă une certaine Ă©poque (prĂ©-Google). Maintenant, l’importance de ces mots-clĂ©s est trĂšs limitĂ©e, voire mĂȘme nulle selon certains.
1.2. Le choix des mots clés
Lorsque l’on cherche Ă mesurer la performance d’un site dans Google, par exemple, on introduit dans le moteur de recherche des mots clĂ©s qui semblent pertinents par rapport au contenu du site en question. Mais ces mots-clĂ©s sont-ils ceux qu’introduiraient les personnes faisant partie du public-cible du site?
Il est en fait trĂšs difficile de deviner quels mots-clĂ©s un internaute recherchant une information donnĂ©e va introduire dans un moteur de recherche. Parfois, les gens y tapent des questions entiĂšres. Parfois juste un mot. Parfois, les mots pour lesquels ils imaginent que le site web dont ils auraient besoin aura Ă©tĂ© optimisĂ©. Et parfois encore, l’information qu’ils tirent du site et qui a de la valeur pour eux n’est pas celle qu’imaginait l’auteur du site.
Se focaliser sur certains mots-clĂ©s n’est donc pas une stratĂ©gie trĂšs porteuse. Il vaut mieux se concentrer sur le rĂ©fĂ©rencement gĂ©nĂ©ral du site et la qualitĂ© de son contenu, et laisser au moteur de recherche le soin de dĂ©terminer quels sont les mots-clĂ©s les plus pertinents pour lui.
1.3. Langue et géographie
Un moteur de recherche comme Google donne la possibilitĂ© de limiter les langues dans lesquelles la recherche est effectuĂ©e, ou de circonscrire la recherche Ă un pays donnĂ©. Il faut cependant prendre garde au fait que la dĂ©tection de la langue ou du pays de provenance d’une page peut facilement ĂȘtre erronĂ©e. La langue est dĂ©tectĂ©e automatiquement en analysant le contenu de la page (ce qui crĂ©e vite des problĂšmes lorsqu’une page contient plus d’une langue), et pour ce qui est du pays, il semblerait que la localisation physique du serveur hĂ©bergeant le site web soit dĂ©terminante.
Notons Ă©galement qu’une recherche “en français” donne des rĂ©sultats lĂ©gĂšrement diffĂ©rents selon qu’on utilise google.fr ou google.ch.
Il ne faut donc pas trop compter sur ces distinctions qui fluctuent facilement — mais elles ont le mĂ©rite de rappeler qu’un site visant un public local est “en compĂ©tition”, pour ce qui est de la pertinence des mots-clĂ©s, avec tous les autres sites publiĂ©s dans la mĂȘme langue. Les seules vĂ©ritables frontiĂšres sur internet sont linguistiques.
2. Que conclure d’un placement insatisfaisant?
C’est souvent le constat d’un placement peu satisfaisant dans les moteurs de recherche qui amĂšne Ă se demander ce que l’on peut faire pour l’amĂ©liorer. Il est important, tout d’abord, de ne pas perdre de vue l’Ă©lĂ©ment de subjectivitĂ© que comporte un tel constat. Le placement n’est pas quelque chose d’absolu: une page va ĂȘtre classĂ©e en fonction de sa pertinence par rapport aux mots-clĂ©s qui ont Ă©tĂ© donnĂ©s comme critĂšres de recherche. La sĂ©lection des mots-clĂ©s doit donc se faire trĂšs soigneusement s’ils doivent servir Ă Ă©valuer d’une façon ou d’une autre si le placement est “bon”.
Les causes d’un placement insatisfaisant peuvent ĂȘtre multiples. Pour y remĂ©dier, il est important des les identifier correctement. Tout d’abord, il faut distinguer parmi les facteurs agissant sur le placement ceux qui sont “internes”, propres au site placĂ©, et donc sur lesquels on peut agir, de ceux qui sont “externes”, sur lesquels on n’a pas prise.
2.1. Facteurs externes
Ils sont au nombre de deux:
- les mots-clés choisis
- les sites “concurrents”
Chaque site est placĂ© dans la liste des rĂ©sultats pour les mots-clĂ©s choisis par rapport aux autres sites ayant un contenu similaire (potentiellement pertinent pour les mots-clĂ©s recherchĂ©s). Obtenir un “bon placement” dans un tel cas de figure sera donc une toute autre histoire s’il s’agit d’un domaine dans lequel il existe quantitĂ© de sites ayant dĂ©jĂ une prĂ©sence forte, ou si le domaine en question est relativement peu documentĂ© sur internet.
2.2. Facteurs internes
Les facteurs internes influençant le positionnement d’un site sont les suivants:
- qualité du contenu
- mise en valeur rédactionnelle du contenu
- mise en valeur technique du contenu
La qualitĂ© du contenu influence de deux maniĂšres le placement. PremiĂšrement, d’une façon tout Ă fait mĂ©canique, comme expliquĂ© plus haut: la frĂ©quence et la place des mots-clĂ©s dans le texte de la page est analysĂ© et interprĂ©tĂ© par le moteur de recherche. Celui-ci, par contre, n’a aucun moyen d’Ă©valuer la “qualitĂ©” d’un texte au sens oĂč un ĂȘtre humain pourrait l’entendre. Cette “qualitĂ©” est en fait mesurĂ©e au nombre de liens entrants Ă©tablis par d’autres crĂ©ateurs de site. Ce n’est donc pas directement le moteur de recherche qui est influencĂ© ici, mais les ĂȘtres humains qui jugeront le contenu digne ou non d’une mention sur leur site.
La “mise en valeur rĂ©dactionnelle” consiste Ă organiser le texte d’une façon qui tienne compte de la maniĂšre dont le moteur de recherche indexera le contenu: que va-t-on regrouper sur une mĂȘme page? Quelles expressions choisir pour les titres? comment utiliser gras, liens, sous-titres de façon adĂ©quate?
La “mise en valeur technique”, quant Ă elle, consiste Ă s’assurer qu’il n’y a pas d’obstacles techniques Ă la bonne indexation du site et Ă la crĂ©ation de liens vers les diffĂ©rentes pages qu’il comporte. Par exemple, on Ă©vitera les cadres (“frames”), les liens en javascript, le balisage non sĂ©mantique, etc.
Lorsque le rĂ©fĂ©rencement n’est pas satisfaisant, il convient donc de repĂ©rer dans quel domaine les amĂ©liorations doivent ĂȘtre faites. Pour ce faire, on regardera dans l’ordre:
- les aspects techniques
- les aspects rédactionnels
- le contenu proprement dit.
En effet, s’il y a des obstacles techniques majeurs Ă une bonne indexation, il ne sert Ă rien de s’acharner Ă amĂ©liorer la qualitĂ© ou l’intĂ©rĂȘt du contenu. Celui-ci est peut-ĂȘtre parfaitement adĂ©quat, mais il n’est simplement pas mis correctement en valeur. Une fois que la qualitĂ© technique du site est assurĂ©e, on peut s’intĂ©resser Ă la technique de rĂ©daction, par exemple en amĂ©liorant la façon dont les titres sont choisis, ou en optimisant la façon dont le contenu est organisĂ© sur les diverses pages du site.
C’est seulement une fois ces questions techniques rĂ©glĂ©es (du moins pour ce qui est des grandes lignes) que l’on peut rĂ©ellement Ă©valuer si la qualitĂ© proprement dite du contenu est en cause. Et Ă ce moment-lĂ , il est important d’inclure dans l’Ă©valuation les facteurs extĂ©rieurs comme la place occupĂ©e par les autres sites consacrĂ©s Ă des sujets similaires.
3. Que faire pour améliorer le placement général ?
Encore une fois, la chose principale Ă faire pour avoir un bon placement est d’avoir un contenu de qualitĂ©. En effet, les algorithmes des moteurs de recherche visent Ă mettre en avant les pages qui sont utiles aux gens faisant les recherches — le contenu est donc primordial.
Les créateurs de sites peuvent ensuite aider les moteurs de recherche à indexer correctement leur contenu en prenant garde à certains points:
Aspects techniques :
- utiliser un balisage HTML propre et sémantique
- prévoir une architecture de site qui encourage les autres propriétaires de sites à faire des liens vers différentes pages de celui-ci
- créer suffisamment de liens entre les différentes parties du site pour permettre une navigation facile (particuliÚrement dans le corps du texte lorsque cela est pertinent)
- utiliser un schĂ©ma d’URL “sympathique” pour les moteurs de recherche
- éviter les frames (cadres), les images représentant du texte et les liens en javascript.
Aspects rédactionnels :
- structurer les pages avec titres et sous-titres
- choisir des titres qui contiennent des mots-clés en adéquation avec le contenu de la page.
On notera qu’il y a deux sortes de “bon placement”: l’autoritĂ© que Google confĂšre Ă une page de façon gĂ©nĂ©rale, ou “PageRank” [5], et la position dans laquelle cette page se trouvera pour la recherche de mots-clĂ©s prĂ©cis.
Une page peut avoir un trĂšs bon PageRank mais ĂȘtre mal placĂ©e pour une recherche selon certains mots-clĂ©s. Cela peut ĂȘtre le cas parce que ces mots-clĂ©s n’occupent pas une place assez prĂ©dominante (au sens de Google) dans la page, voire n’y figurent pas (!). Mais aussi, d’autres sites existent peut-ĂȘtre dont le contenu relatif Ă ces mots-clĂ©s est plus pertinent. Cette pertinence apparaĂźtra (aux yeux du moteur de recherche) Ă travers la place qu’occupent ces mots-clĂ©s dans le contenu de la page en question et des pages proches, et surtout Ă travers les liens entrants vers cette page: le texte de ces liens utilise-t-il rĂ©guliĂšrement ces mots-clĂ©s, ou non?
Par exemple, on trouvera normal qu’en tapant les mots-clĂ©s “prĂ©vention+sida” le premier rĂ©sultat apparaissant soit , un site consacrĂ© uniquement Ă la prĂ©vention Sida, plutĂŽt que , la page Ă ce sujet sur ciao.ch, un site qui comporte des informations sur des sujets trĂšs variĂ©s.
4. Qu’apporte un bon placement ?
Il peut ĂȘtre utile de regarder d’un peu plus prĂšs les raisons qui poussent Ă vouloir un bon placement dans un moteur de recherche. Effectivement, un site bien placĂ©, qui se situe dans les premiers rĂ©sultats pour les mots-clĂ©s que recherchent les gens qui seraient intĂ©ressĂ©s par le contenu du site, va attirer plus de visiteurs par ce biais.
Gardons cependant Ă l’esprit que le placement est un moyen d’attirer des visiteurs, et non une fin en soi. Ce n’est d’ailleurs pas le seul moyen d’attirer des visiteurs sur son site: les gens peuvent aussi y arriver parce qu’ils ont cliquĂ© sur un lien se trouvant sur un autre site, parce qu’on leur en a parlĂ©, ou qu’on leur a envoyĂ© l’adresse par e-mail, chat, ou messagerie instantanĂ©e.
Ces derniers moyens font intervenir quelque chose qui est de l’ordre du bouche Ă oreille: une recommandation “de personne Ă personne”, qui est gĂ©nĂ©ralement beaucoup plus efficace qu’une entrĂ©e dans un rĂ©pertoire automatisĂ© (le moteur de recherche), et qui prend de plus en plus d’importance dans l’internet d’aujourd’hui. Un lien sur un site web est une recommandation, et cela d’autant plus si ce site est un site personnel, comme un blog, par exemple.
Bien entendu, les rĂ©sultats des moteurs de recherche vont reflĂ©ter la part “internet” de ces recommandations en bouche Ă oreille. Une adresse web transmise dans une liste de discussion par e-mail va se retrouver indexĂ©e via les archives en ligne de celle-ci. Les blogs sont des sites internet, et “comptent” Ă©videmment pour le moteur de recherche — d’autant plus que bon nombre d’entre eux sont en fait trĂšs bien “cotĂ©s” (PageRank).
Si beaucoup de propriĂ©taires de sites jugent que le contenu d’un site vaut la peine qu’on en parle, le placement de ce site dans les moteurs de recherche va s’en trouver amĂ©liorĂ©, mais ce placement est la consĂ©quence de cet intĂ©rĂȘt et non sa cause. Tenter d’agir directement sur le placement est donc insuffisant: c’est le contenu du site qui va jouer un rĂŽle prĂ©pondĂ©rant.
Conclusion
Le placement d’un site dans un moteur de recherche est un indicateur de qualitĂ© parmi d’autres. Ce placement ne peut pas ĂȘtre contrĂŽlĂ©, et ne dĂ©pend pas uniquement du site concernĂ© — il est toujours relatif au reste du matĂ©riel existant sur internet.
Il est bien plus efficace d’agir sur le contenu et la qualitĂ© formelle d’un site afin de l’amĂ©liorer plutĂŽt que de chercher Ă obtenir directement un rĂ©sultat en termes de placement par rapport Ă certains mots-clĂ©s, objectif qui est souvient peu rĂ©aliste.
Notes
- La plupart des moteurs de recherche fonctionnent sur le modĂšle de Google. Si ce document parle des moteurs de recherche en gĂ©nĂ©ral, c’est plus particuliĂšrement de Google et des moteurs de recherche fonctionnant sur des principes similaires dont il s’agit ici.
- Les organisations qui garantissent un placement dans les x premiers rĂ©sultats pour tel ou tel mot-clĂ© utilisent des techniques peu Ă©thiques qui reviennent en somme Ă tricher avec les algorithmes de classement des moteurs de recherche []. D’un moyen pour mesurer quelque chose (la qualitĂ©), le placement devient un but en soi.
- Google tient en effet Ă©galement compte des mots utilisĂ©s pour crĂ©er des liens vers une page donnĂ©e. Le “googlebombing” abuse de ce fait pour imposer une page spĂ©cifique en premiĂšre position lorsqu’on l’on recherche certains mots-clĂ©s, en obtenant qu’un grand nombre de sites Web utilisent ceux-ci dans le texte de liens pointant vers cette page. Un exemple cĂ©lĂšbre plaçait la biographie officielle de George Bush en premiĂšre position des rĂ©sultats lorsque l’on cherchait l’expression “miserable failure”, mĂȘme si la page ne contenait bien sĂ»r pas cette expression. Voir aussi .
- Ces fameux mots-clĂ©s, importants pour les moteurs de recherche de la gĂ©nĂ©ration prĂ©cĂ©dant Google, sont ceux que l’on place dans la balise HTML .
- Le PageRank est une valeur allant de 0 à 10 et qui est basée sur le nombre de liens entrants vers une page, pondérée par la valeur de PageRank de la page sur laquelle se trouve ce lien.
A lire aussi, en anglais: Matt Cutts: Whitehat SEO Tips For Bloggers, les notes que j’ai prises lors de sa confĂ©rence Ă WordCamp (San Francisco).