Content Curation: Why I'm Not Your Target Audience [en]

[fr] Je suis trop efficace avec un moteur de recherche pour être très emballée par les divers outils qui visent à organiser la masse de contenu à disposition sur le web, en temps réel ou non.

In Paris, I had a sudden flash of insight (during a conversation with somebody, as often). Most services designed to help with content curation don’t immediately appeal to me because I’m not their target audience: I’m too good at using search.

I was trying to figure out why, although I liked the idea behind PearlTrees and SmallRivers (I tried them out both briefly), part of me kept thinking they weren’t really adding anything that we couldn’t already do. Well, maybe not that exactly, but I couldn’t really see the point. For example: “PearlTrees, it’s just bookmarking with pretty visual and social stuff, right?” or “SmallRivers, we already have hyperlinks, don’t we?” — I know this is unfair to both services, and they go beyond that, but somehow, for me, it just didn’t seem worth the effort.

And that’s the key bit: not worth the effort. When I need to find something I’ve seen before, I search for it. I understand how a search engine works (well, way more than your average user, let’s say) and am pretty good at using it. I gave up using bookmarks years ago (today, I barely use delicious anymore — just look at my posting frequency there). I stick things in Evernote and Tumblr because I can search for them easily afterwards. I don’t file my e-mail, or even tag it very well in gmail — I just search when I need a mail. I don’t organize files much on my hard drive either, save for some big drawers like “client xyz”, business, personal, admin — and those are horribly messy.

I search for stuff. And to be honest, now that I’ve discovered Google Web History, I’m not sure what else I could ever ask for. It embodies an old old fantasy of mine: being able to restrict a fulltext search to pages I’ve visited in a certain timeframe. “Damn, where did I put this?” becomes a non-issue when you can use Google search over a subset of the web which contains all the pages you’ve ever loaded up in your browser. (Yeah, privacy issues, certainly.)

What about the social dimension of these curation tools? Well, I’m a blogger. I blog. When I want to share, I put stuff in my blog, or Tumblr. I’m actually starting to like PearlTrees for that, because it is a nice way of collecting and ordering links — but really, I’m not the kind of person who has a lot of patience for that kind of activity. Some people spend time keeping their bookmarks, e-mails, or files in order. I don’t — there are way too many more interesting things for me to spend my time on. So I keep things in a mess, and when I need something out of them, I search.

I think I’m just not a content curator, aside from my low-energy activities like tweeting, tumblring, and blogging.

It doesn’t mean there is no need for content curation, of the live stream or more perennial content like “proper” web pages. But just like some people are bloggers and some aren’t, I think some people are curators and some aren’t.

Google Identity Dilemma [en]

[fr] Depuis des années, j'utilise une identité "fantaisiste" pour tous mes services Google. C'est mon identité principale (vous voyez de laquelle je parle si on est en contact). J'aimerais passer à prénom.nom comme identité principale (je la possède aussi) mais tous les services Google sont rattachés à la première, et je ne vois pas vraiment comment m'en sortir. Idées bienvenues!

When I created a Gmail address all these years ago, I chose a “funny-cute” name that was easy to remember for most of the people I knew. I was on IRC all day back then, and my nickname was bunny(wabbit_), and people knew I was Swiss.

I didn’t really think my Gmail address would become so central to my online identity, you see.

Of course, I also registered firstname.lastname and redirected it onto my main e-mail address and identity.

As years went by, Google added all sorts of services that got tied onto this identity (not to mention the 2.5Gb of archived e-mails and chats). Google Talk, Google Profiles, and recently, Google Sidewiki and Google Wave.

These last weeks, I’ve been wondering if I shouldn’t “make the switch” and use my more serious “firstname.lastname” e-mail address as my main identity. Actually, to be honest, I’d like to. But there are obstacles — oh, so many.

First, all my contacts are linked to my current account. All my e-mail is stuck in it. My Feedburner and Google Reader settings are linked to it. My blogger blog is. My calendar. Everywhere I use my Google identity for a third-party service, here we go.

And Google does not allow you to link one Google account to another (sure, you can redirect mail, but that doesn’t solve anything).

So, do you see my problem? If you have any bright ideas, I’m listening. I would really like a solution.

A Few Words About Google Wave [en]

I wanted to write this post yesterday, to keep up with my good resolutions, but time caught up with me and I had to leave my computer to go and enjoy some time on the lake (we finished 13th, and I had a good windy sailing lesson before that — thanks Dad).

So, as for most of you I guess, Google Wave came up on my Twitter radar these last days. I thought I’d take a quick peek, without spending the whole day on it, so I looked at part of the demo video (the first part, where the actual demo is), and read a few articles (CNET, Mashable and ReadWriteWeb — there are tons of others, but I’m on purpose trying not to be exhaustive in my research… fight that perfectionism!)

In one word? Cool.

I remember many years ago, how taking collaborative notes in SubEthaEdit during the BlogTalk conference in Vienna would every now and then drift into us chatting in the document. (By the way: I’m on the Programme Committee for BlogTalk 2009 which will take place in Jeju, South Korea, on September 1-2. Send in your proposals now!)

I also remember, how many years before that, ICQ introduced “real-time chat” (or whatever they called it), where you could actually see people type when you chatted with them.

And I remember the many many days I’ve spent in endless wiki conversations — I think one of the best ways I can describe Google Wave is to say it’s a very accelerated wiki page with bells and a touch of Facebook.

Google Wave is marrying e-mail and IM, and it’s a good thing. It’s recording the process of the conversation, which makes it easier for outsiders to jump in. It has private, it has public, it has text, it has rich media, it has profiles.

People say it’s a bit hard to get at first, and that, in my opinion, is another indication that it is something really new.

I can’t wait to try it. I get all excited when I think of it. These are my totally uninformed first impressions. Over the years, I’ve come to trust those — Google Wave is going to change things.

Démarrer avec Google Reader [en]

[fr] Getting started with Google Reader, for my French readers.

Comme ces temps je n’arrête pas d’initier des gens de mon entourage à Google Reader, je me suis dit, allez, hop, quelques instructions par écrit.

Google Reader, c’est un lecteur RSS (ah oui, c’était en 2003 que j’expliquais ça, un peu trop en avance, pour changer) auquel vous avez accès si vous avez un compte GMail (qui n’en a pas?). En bref, ça permet de centraliser en un seul endroit toutes vos lectures de blogs et de nouvelles.

Dans votre GMail, cliquez sur “Reader” en haut à droite. Ça ressemble à ça:

Google Reader: accueil

Première chose à faire: ajouter un abonnement.

Google Reader: ajouter un abonnement

Définissez (si vous le désirez) un dossier pour votre abonnement. Vous pouvez ainsi séparer vos lectures par centre d’intérêt. C’est utile, car ensuite vous pouvez regarder toutes les “nouveautés” dans une seule catégorie sans vous soucier des autres. Exemples: blogs, mes amis, trucs préférés, nouvelles, horticulture, technique… bref.

Google Reader: s'abonner à un blog

Ajoutez autant d’abonnements que vous voulez:

Google Reader: détail d'ajout d'abonnement

Voilà, c’est aussi facile que ça!

Google Reader: tour du proprio

Au prochain épisode, je vous montrerai comment profiter des fonctionnalités “sociales” de Google Reader, et je vous présenterai Feedly, une extension Firefox qui “habille” Google Reader de tout un tas de trucs sympas (sans compter que c’est beaucoup plus agréable à l’oeil).

Google Reader: changer la langue

A bientôt!

Google: "Don't Mix Languages on the Same Page" [en]

[fr] Dommage, un article sur comment démarrer son site multilingue sur un des blogs officiels de Google donne des conseils que je trouve assez malheureux (genre: "ne mélangez pas plusieurs langues sur une même page").

I wanted to leave this as a comment on How to Start a Multilingual Site over on the Official Google Webmaster Central Blog, but unfortunately Blogger is taking a break right now and I can’t post. So, here we go:

“Avoid mixing languages on each page, as this may confuse Googlebot as well as your users.” (Nico, thanks, I’d missed that one)

I’m really disappointed to see this kind of advice handed out. Yes, it confuses Googlebot, but only because it doesn’t (I guess?) take into account lang=”xx” attributes. (Yeah, nobody uses them, but that’s because nobody parses them.)

But users? Most people are not pure monolinguals. We need ways to make linguistic barriers online weaker, and not stronger.

I’ve been mixing languages on Climb to the Stars for eight years now, and it hasn’t prevented my readers or my Page Rank from being happy.

I vote for Google learning that the “page” is not the smallest item on the web that is allowed to have its own language attribute, rather than asking people to conform to some kind of artificial absolute monolingualism.

I’ll try an post tomorrow, but at least this is out there. I left a previous comment on the same post earlier today, by the way. (Check out my other multilingual stuff while you’re on the topic.)

Google Groups Pain in the Neck [en]

[fr] Google Groups trouve qu'il n'est pas raisonnable de vouloir ajouter plus d'une dizaine de personnes à la fois à une newsletter nouvellement créée.

I’ve used Google Groups to set up a newsletter for Going Solo.

Here it is, with added proof (if needed) of my hopeless lack of design sense.

When I set up the group, I did what most normal newsletter creators would do: went through my contacts to invite those who might be interested in joining. I selected 30 or so people to start with.

My action triggered a flag for review, as I might be a potential spammer:

Your request to invite X new members has been flagged for review by our staff.

In order to protect our members from unsolicited email, Google manually reviews invite requests which meet various criteria. Your request will not be reviewed unless you provide us with more information in the form below. Reviews generally take 1 – 2 business days.

Please provide an explanation for where these new members come from and why they would want to be part of your group. Note that Google takes a very dim view of Spam. The people you invite must know you and be expecting your message. If they complain, you will be banned from our service and your group will be deleted.

Great.

Well, I wrote up an explanation, saying I was setting up this newsletter so that people could stay informed about Going Solo (registration is closing soon btw), and that I was going through my address book to let people know about it.

Anything wrong with that, in your opinion? I think not, and Google obviously didn’t think there was anything wrong either, because they let my invitations go through after a few hours.

BUT.

Now, each time I invite even one single person, my request is flagged.

Google Groups: Threatening!

What a pain! I’m going to be inviting people many times a day over the next week, as I dig out e-mail addresses. And obviously, just announcing the existence of the newsletter is not enough to get people to sign up — ever heard of lower the barrier to entry? If I’m creating this newsletter, it’s because I’m finally coming to my senses (!) and realising that not everybody follows Twitter, subscribes to blogs, hangs out on Facebook or upcoming, and that good ol’ e-mail still has some good days before it when it comes to getting information out to people.

I am really annoyed at Google Groups for making this so difficult. Shouldn’t there be a way for me to get the limit “lifted” for my group, by offering proof I’m not a nasty spammer, but a businesswoman (OMG!) who is very much aware that she will very quickly use up her social capital if she spams her network with irrelevant stuff? And therefore, that I actually need to send out invites to a few hundred people?

Also, look at this form:

Google Groups invite members

Don’t you think that “e-mail addresses” field invites a reasonably large number of addresses?

I went through the help, and it wasn’t very encouraging, but I did learn a few useful things:

So, please. If you have friends working on Google Groups, please draw their attention to this post and issue. It’s a bloody pain in the neck.

Oh yeah — and please sign up for the newsletter. I’m going to have trouble inviting you 😉 — [email protected] also works.

LIFT08: Kevin Marks (Google Open Social: The Social Cloud) [en]

Insert standard disclaimer about live notes.

LIFT08 168

The cloud is an abstraction, because we don’t want to think about what’s in between, or inside the cloud.

Send a message anywhere, and it’ll come out at the other end.

For Andrew Marks, Kevin’s son, the net is just part of the world. The older generation sees the net as a big cloud of poison gas. Has an impact on how we deal with the social software environment.

We assume e-mail is there and part of the web, but for the young generation it’s there to talk to adults, not really exciting. Standard boring stuff.

Their blog or their social network is “them”, but not their e-mail.

URLs are people too. Some of these pages on the internet are people. My blog is me. Links between these websites which are people are in fact expressing relationships. XFN.

Social Graph API: finds the websites that can be treated as people, and returns “me” and “friend” links between them. XFN + FOAF + Google crawler.

Problem: too many social networks!! Problem for the developers too! Need to make people sign up again, and tell who their friends are, etc…

“I want my own private island!”

The Social Graph API can help you find the friends you have on another site in the new system. Tell Twitter what your homepage is, and then Twitter will go and look up people-URLs who are linked to your homepage and in the Twitter system already, and assist you in making those connections. Finding me and my public friends on the web.

In social network land: “my friends are all here already, I’m quite happy on MySpace, don’t want to emigrate!” BUT my relationships aren’t all public, and change depending on what I’m here to do.

We put clouds around things so we don’t have to think about them. Registration, creating links between users…

OpenSocial is putting clouds around things that you don’t want to have to worry about. Take your application where the people are.

A third thing we need to worry about it: the nature of relationships. As danah boyd says, people don’t break friend links on a social networking site, except if there has been a messy break-up. Nothing less severe than that really justifies un-friending people. But when people get fed-up, they lose their password or destroy their profile, and create a new one from scratch with fewer friends. steph-note: like people used to do with blogrolls 5 years ago.

Technology mustn’t be perfect.

XFN isn’t subtle enough to render the relationships in Pride and Prejudice.

LIFT08 172

Douglas Adams: “Of course you can’t trust what people tell you on the web, not more than you can trust what people tell you megaphones… etc” 1999

The abstraction (trust, friendship, context) is in your head. It’s not explicit. The software never has a chance to understand this.

OpenSocial puts a cloud around social networking sites, the details of people, friends, etc. In the future, users could assume that your software will know about your friends, relationships, profile information. Could be implicit. In the cloud. An abstraction that any piece of software could use.

In the same way, the abstraction layer in your head provides information that you use in a way in any social software. steph-note: not sure I got that last bit right.

You can (and should) watch Kevin’s LIFT08 talk on video.

Désinformation en 20 secondes: Google Reader [fr]

[en] A brief note about the Google Reader Shared Items problem in a local free newspaper gives the impression that Google is sharing all subscribed feeds with our chat buddies. I can't stand by and watch this kind of stuff without reacting.

Lundi 31 décembre 2007. Je suis dans le bus. Comme souvent lorsque je suis dans le bus, je feuillette le journal gratuit 20 minutes. J’arrive à la page multimédia, que je lis généralement avec intérêt, car elle me donne un point de repère : qu’est-ce qui est « mainstream », qu’est-ce qui ne l’est pas ? Soudain, mes yeux tombent sur la dépêche suivante, qui me fait littéralement bondir :

Google encore épinglé

Le moteur de recherche a mis en place une fonctionnalité intrustive qui partage automatiquement les listes de flux RSS de Google Reader avec les contacts Google Talk d’un membre. Malgré les protestations, Google refuse pour l’heure de modifier le système.

Très clairement, la personne qui a rédigé cette dépêche n’a pas pris plus de 20 secondes pour vérifier ce qu’elle était en train de raconter. Difficile de faire mieux en matière de désinformation primaire.

Des explications ? Mais bien sûr. Je l’ai même déjà fait ici (c’est un article en anglais, mais il y a un résumé en français assez complet).

À en croire 20 minutes, ce que fait Google Reader, c’est de partager sans autre forme de procès toute la liste des flux RSS auxquels vous est abonnés avec vos partenaires de chat. Ça, ce serait effectivement scandaleux !

En réalité, Google ne met à disposition de vos partenaires de chat que les articles, parmi tous ceux que vous recevez via vos flux RSS, que vous avez expressément choisi de partager via vos “Shared Items”. En pratique, cela ressemble à ça. Si vous voyez un article qui vous plaît, vous cliquez simplement sur “Share”:

Google Reader Shared Items

Pas tout à fait la même chose !

Il reste bien entendu le problème que cette « page publique » est accessible via une adresse compliquée, et donc pas si privée que ça… Mais c’est un autre problème.

Un cactus pour 20 minutes, donc, pour avoir contribué à la désinformation ambiante au sujet des technologies du Web.

Google Shared Stuff: First Impressions [en]

[fr] Google Shared Stuff, nouveau venu dans l'arène du social bookmarking. Pas convaincue qu'ils aient pour le moment quelque chose de plus à apporter que leurs concurrents déjà bien établis.

I’ve briefly tried Google Shared Stuff, and here are my first impressions. I’m one of those horrible people who always see what the problems are instead of what’s good, so I’ll just say as a preamble to the few gripes I’m raising here that overall, it looks neat, shiny, and it works roughly as it should.

Profile Photo

Your Shared Stuff -- Upload Picture

  • nice: I can choose photos from various sources
  • not so nice: “The photo you specify here will be used across all Google products and services which display your public photo, including Google Talk and Gmail.”

I already have a photo in my Gmail/Google Talk profile. Why can’t you use it? If I upload a photo here, is it going to overwrite it? Need more info, folks.

Private vs. Public

This is my shared stuff:

Your Shared Stuff -- As I See It

Shared stuff can be public or private. Above is the page as I, the account owner see it. Below is the page that the public sees:

Shared Stuff from Stephanie Booth -- As Everyone Sees It

See the missing link? (Not difficult, there are only two in total.) “Hah, you’ll say, you made the second link private! That’s why the public can’t see it!” Try again:

Trying - And Failing - To Share CTTS

The link was shared as “public”. This is obviously broken in some way, folks. Please fix it.

Email/Share Bookmarklet

The bookmarklet is nice, but nothing revolutionary:

Sharing Bookmarklets and Buttons

What about the sharing pane? It looks very much like the del.icio.us sharing pane, but more cluttered. The nice thing is that it lets you choose a photo to illustrate your share (like FaceBook does, for example):

Google Shared Stuff Email / Share Bookmarklet Pane

del.icio.us Sharing Pane

Besides being less cluttered, the del.icio.us pane has a huge advantage over the Google one: it’s a resizable window. Really really appreciated when a link you clicked (or a page opened by Skitch) uses that window for the new tab.

One interesting feature of this sharing pane is that it allows you to share to other social bookmarking services — not just Google’s. That’s nice. Open. No lock-in. But… isn’t it a bit pointless when I can access the del.icio.us bookmarking pane in just one click instead of three?

Google Shared Stuff Bookmarklet Pane

What I Wish For

One-Click

I’d like a one-click bookmarklet which works exactly like the “Share” button in Google Reader:

Google Reader Share Button

Clicking the “Share” button adds the post to the stream of my Shared Items page/feed. Painless. I can easily add them to my sidebar:

Google Shared Items on CTTS

However, now that I’m using the Google Reader “Next” bookmarklet more, I find that I’m in Google Reader less, so something like a “Share Bookmarklet” (Google Reader-style) would come in really handy.

The main point here is that to share something in Google Reader, I click once. With Shared Stuff or del.icio.us, I click at least twice.

Holes in Buckets!

So here we are. Again. Make all this stuff communicate, will ya? When I share stuff in Google Reader, I’d love it to be pushed to my del.icio.us account automatically, with a preset tag or tags (“shareditem” for example). It annoys me to have links I’ve saved in del.icio.us and in Shared Items (Google Reader). It’s not as bad as it was when you couldn’t search Google Reader, but still.

Am I going to add yet another list of “shared stuff” to my online ecosystem? That’s the question. Make that bookmarklet share to Google Reader Shared Items, and let me push all that to del.icio.us, and you’ll really have something that adds value for me.

Otherwise, I’m not sure where Shared Stuff will fit in my social bookmarking life.

Le placement dans les moteurs de recherche [fr]

[en] A document on how search engins function and how to improve indexing for your site, which I wrote for a client over June/July. If this interests you, you should definitely check out my notes on Matt Cutts' Whitehad SEO tips for bloggers.

Ceci est un document rédigé pour un client en juin/juillet 2007. Un grand merci à Béatrice pour son assistance éditoriale! Si vous voulez l’imprimer et le lire tranquillement, je vous recommande de télécharger le PDF (6 pages). Ce document est distribué sous une licence Creative Commons by-nc-sa.

Introduction

On est souvent tenté de mesurer le succès d’un site internet par son placement dans les moteurs de recherche [1]. En effet, un bon placement dans les moteurs de recherche peut être un indicateur parmi d’autres du succès d’un site. Malheureusement, le fonctionnement des moteurs de recherche en général et du positionnement en particulier est difficile à comprendre et amène souvent à avoir des attentes peu réalistes en la matière, en particulier l’exigence des résultats précis pour certains mots-clés donnés.

Le positionnement dans un moteur de recherche ne peut pas être contrôlé [2]. On peut l’influencer positivement en soignant certains aspects techniques ou rédactionnels du site, mais le facteur principal dans un bon placement demeurera inévitablement la qualité du contenu.

En fait, le placement dans les moteurs de recherche est une conséquence de la popularité d’un site, et non sa cause. (Même si, bien entendu, un bon placement peut amener des visiteurs au site — mais un bon placement seul ne suffit pas.)

1. Comment fonctionne un moteur de recherche ?

1.1. Fonctionnement général

La fonction principale d’un moteur de recherche est de fournir à son utilisateur la liste des pages Internet correspondant aux mots-clés que celui-ci aura spécifiés. Généralement [3], cela revient à fournir une liste de pages contenant ces mots-clés. Cela est en soi une opération relativement simple. Ce qui est très complexe, par contre, c’est le classement de tous ces résultats afin de mettre en tête de liste les plus pertinents. L’algorithme utilisé par Google à cet effet est secret, et comprend une bonne centaine de variables. On saisit donc aisément pourquoi il n’est pas possible de contrôler sa position dans un moteur de recherche. D’ailleurs, si ça l’était, ce positionnement perdrait tout son sens…

Le premier facteur qui va influencer le placement est bien entendu le contenu de la page : les mots-clés y apparaissent-ils? Sont-ils proches les uns des autres, ou bien éloignés ? Apparaissent-ils une seule fois, ou bien plusieurs fois ? Apparaissent-ils dans le titre de la page, dans les divers titres qui organisent le contenu de celle-ci, dans le corps du texte, en gras, dans un lien, dans des citations, en haut de la page, en bas de la page… ?

Un autre facteur qui va avoir beaucoup d’influence sur “l’autorité” que Google accordera à un site Web est le nombre de liens entrants vers ce site. De plus, la provenance de ces liens a une importance : le “pagerank” (autorité) se calcule de façon circulaire. Logiquement, les liens provenant de sites dont l’autorité est déjà reconnue auront plus d’impact que des liens provenant de sites moins cotés (mais un grand nombre de liens provenant de sites peu cotés comptera également…).

Le fait de définir des “mots-clés” [4] dans les différentes pages du site était très important pour le placement dans les moteurs de recherche à une certaine époque (pré-Google). Maintenant, l’importance de ces mots-clés est très limitée, voire même nulle selon certains.

1.2. Le choix des mots clés

Lorsque l’on cherche à mesurer la performance d’un site dans Google, par exemple, on introduit dans le moteur de recherche des mots clés qui semblent pertinents par rapport au contenu du site en question. Mais ces mots-clés sont-ils ceux qu’introduiraient les personnes faisant partie du public-cible du site?

Il est en fait très difficile de deviner quels mots-clés un internaute recherchant une information donnée va introduire dans un moteur de recherche. Parfois, les gens y tapent des questions entières. Parfois juste un mot. Parfois, les mots pour lesquels ils imaginent que le site web dont ils auraient besoin aura été optimisé. Et parfois encore, l’information qu’ils tirent du site et qui a de la valeur pour eux n’est pas celle qu’imaginait l’auteur du site.

Se focaliser sur certains mots-clés n’est donc pas une stratégie très porteuse. Il vaut mieux se concentrer sur le référencement général du site et la qualité de son contenu, et laisser au moteur de recherche le soin de déterminer quels sont les mots-clés les plus pertinents pour lui.

1.3. Langue et géographie

Un moteur de recherche comme Google donne la possibilité de limiter les langues dans lesquelles la recherche est effectuée, ou de circonscrire la recherche à un pays donné. Il faut cependant prendre garde au fait que la détection de la langue ou du pays de provenance d’une page peut facilement être erronée. La langue est détectée automatiquement en analysant le contenu de la page (ce qui crée vite des problèmes lorsqu’une page contient plus d’une langue), et pour ce qui est du pays, il semblerait que la localisation physique du serveur hébergeant le site web soit déterminante.

Notons également qu’une recherche “en français” donne des résultats légèrement différents selon qu’on utilise google.fr ou google.ch.

Il ne faut donc pas trop compter sur ces distinctions qui fluctuent facilement — mais elles ont le mérite de rappeler qu’un site visant un public local est “en compétition”, pour ce qui est de la pertinence des mots-clés, avec tous les autres sites publiés dans la même langue. Les seules véritables frontières sur internet sont linguistiques.

2. Que conclure d’un placement insatisfaisant?

C’est souvent le constat d’un placement peu satisfaisant dans les moteurs de recherche qui amène à se demander ce que l’on peut faire pour l’améliorer. Il est important, tout d’abord, de ne pas perdre de vue l’élément de subjectivité que comporte un tel constat. Le placement n’est pas quelque chose d’absolu: une page va être classée en fonction de sa pertinence par rapport aux mots-clés qui ont été donnés comme critères de recherche. La sélection des mots-clés doit donc se faire très soigneusement s’ils doivent servir à évaluer d’une façon ou d’une autre si le placement est “bon”.

Les causes d’un placement insatisfaisant peuvent être multiples. Pour y remédier, il est important des les identifier correctement. Tout d’abord, il faut distinguer parmi les facteurs agissant sur le placement ceux qui sont “internes”, propres au site placé, et donc sur lesquels on peut agir, de ceux qui sont “externes”, sur lesquels on n’a pas prise.

2.1. Facteurs externes

Ils sont au nombre de deux:

  • les mots-clés choisis
  • les sites “concurrents”

Chaque site est placé dans la liste des résultats pour les mots-clés choisis par rapport aux autres sites ayant un contenu similaire (potentiellement pertinent pour les mots-clés recherchés). Obtenir un “bon placement” dans un tel cas de figure sera donc une toute autre histoire s’il s’agit d’un domaine dans lequel il existe quantité de sites ayant déjà une présence forte, ou si le domaine en question est relativement peu documenté sur internet.

2.2. Facteurs internes

Les facteurs internes influençant le positionnement d’un site sont les suivants:

  • qualité du contenu
  • mise en valeur rédactionnelle du contenu
  • mise en valeur technique du contenu

La qualité du contenu influence de deux manières le placement. Premièrement, d’une façon tout à fait mécanique, comme expliqué plus haut: la fréquence et la place des mots-clés dans le texte de la page est analysé et interprété par le moteur de recherche. Celui-ci, par contre, n’a aucun moyen d’évaluer la “qualité” d’un texte au sens où un être humain pourrait l’entendre. Cette “qualité” est en fait mesurée au nombre de liens entrants établis par d’autres créateurs de site. Ce n’est donc pas directement le moteur de recherche qui est influencé ici, mais les êtres humains qui jugeront le contenu digne ou non d’une mention sur leur site.

La “mise en valeur rédactionnelle” consiste à organiser le texte d’une façon qui tienne compte de la manière dont le moteur de recherche indexera le contenu: que va-t-on regrouper sur une même page? Quelles expressions choisir pour les titres? comment utiliser gras, liens, sous-titres de façon adéquate?

La “mise en valeur technique”, quant à elle, consiste à s’assurer qu’il n’y a pas d’obstacles techniques à la bonne indexation du site et à la création de liens vers les différentes pages qu’il comporte. Par exemple, on évitera les cadres (“frames”), les liens en javascript, le balisage non sémantique, etc.

Lorsque le référencement n’est pas satisfaisant, il convient donc de repérer dans quel domaine les améliorations doivent être faites. Pour ce faire, on regardera dans l’ordre:

  • les aspects techniques
  • les aspects rédactionnels
  • le contenu proprement dit.

En effet, s’il y a des obstacles techniques majeurs à une bonne indexation, il ne sert à rien de s’acharner à améliorer la qualité ou l’intérêt du contenu. Celui-ci est peut-être parfaitement adéquat, mais il n’est simplement pas mis correctement en valeur. Une fois que la qualité technique du site est assurée, on peut s’intéresser à la technique de rédaction, par exemple en améliorant la façon dont les titres sont choisis, ou en optimisant la façon dont le contenu est organisé sur les diverses pages du site.

C’est seulement une fois ces questions techniques réglées (du moins pour ce qui est des grandes lignes) que l’on peut réellement évaluer si la qualité proprement dite du contenu est en cause. Et à ce moment-là, il est important d’inclure dans l’évaluation les facteurs extérieurs comme la place occupée par les autres sites consacrés à des sujets similaires.

3. Que faire pour améliorer le placement général ?

Encore une fois, la chose principale à faire pour avoir un bon placement est d’avoir un contenu de qualité. En effet, les algorithmes des moteurs de recherche visent à mettre en avant les pages qui sont utiles aux gens faisant les recherches — le contenu est donc primordial.

Les créateurs de sites peuvent ensuite aider les moteurs de recherche à indexer correctement leur contenu en prenant garde à certains points:

Aspects techniques :

  • utiliser un balisage HTML propre et sémantique
  • prévoir une architecture de site qui encourage les autres propriétaires de sites à faire des liens vers différentes pages de celui-ci
  • créer suffisamment de liens entre les différentes parties du site pour permettre une navigation facile (particulièrement dans le corps du texte lorsque cela est pertinent)
  • utiliser un schéma d’URL “sympathique” pour les moteurs de recherche
  • éviter les frames (cadres), les images représentant du texte et les liens en javascript.

Aspects rédactionnels :

  • structurer les pages avec titres et sous-titres
  • choisir des titres qui contiennent des mots-clés en adéquation avec le contenu de la page.

On notera qu’il y a deux sortes de “bon placement”: l’autorité que Google confère à une page de façon générale, ou “PageRank” [5], et la position dans laquelle cette page se trouvera pour la recherche de mots-clés précis.

Une page peut avoir un très bon PageRank mais être mal placée pour une recherche selon certains mots-clés. Cela peut être le cas parce que ces mots-clés n’occupent pas une place assez prédominante (au sens de Google) dans la page, voire n’y figurent pas (!). Mais aussi, d’autres sites existent peut-être dont le contenu relatif à ces mots-clés est plus pertinent. Cette pertinence apparaîtra (aux yeux du moteur de recherche) à travers la place qu’occupent ces mots-clés dans le contenu de la page en question et des pages proches, et surtout à travers les liens entrants vers cette page: le texte de ces liens utilise-t-il régulièrement ces mots-clés, ou non?

Par exemple, on trouvera normal qu’en tapant les mots-clés “prévention+sida” le premier résultat apparaissant soit , un site consacré uniquement à la prévention Sida, plutôt que , la page à ce sujet sur ciao.ch, un site qui comporte des informations sur des sujets très variés.

4. Qu’apporte un bon placement ?

Il peut être utile de regarder d’un peu plus près les raisons qui poussent à vouloir un bon placement dans un moteur de recherche. Effectivement, un site bien placé, qui se situe dans les premiers résultats pour les mots-clés que recherchent les gens qui seraient intéressés par le contenu du site, va attirer plus de visiteurs par ce biais.

Gardons cependant à l’esprit que le placement est un moyen d’attirer des visiteurs, et non une fin en soi. Ce n’est d’ailleurs pas le seul moyen d’attirer des visiteurs sur son site: les gens peuvent aussi y arriver parce qu’ils ont cliqué sur un lien se trouvant sur un autre site, parce qu’on leur en a parlé, ou qu’on leur a envoyé l’adresse par e-mail, chat, ou messagerie instantanée.

Ces derniers moyens font intervenir quelque chose qui est de l’ordre du bouche à oreille: une recommandation “de personne à personne”, qui est généralement beaucoup plus efficace qu’une entrée dans un répertoire automatisé (le moteur de recherche), et qui prend de plus en plus d’importance dans l’internet d’aujourd’hui. Un lien sur un site web est une recommandation, et cela d’autant plus si ce site est un site personnel, comme un blog, par exemple.

Bien entendu, les résultats des moteurs de recherche vont refléter la part “internet” de ces recommandations en bouche à oreille. Une adresse web transmise dans une liste de discussion par e-mail va se retrouver indexée via les archives en ligne de celle-ci. Les blogs sont des sites internet, et “comptent” évidemment pour le moteur de recherche — d’autant plus que bon nombre d’entre eux sont en fait très bien “cotés” (PageRank).

Si beaucoup de propriétaires de sites jugent que le contenu d’un site vaut la peine qu’on en parle, le placement de ce site dans les moteurs de recherche va s’en trouver amélioré, mais ce placement est la conséquence de cet intérêt et non sa cause. Tenter d’agir directement sur le placement est donc insuffisant: c’est le contenu du site qui va jouer un rôle prépondérant.

Conclusion

Le placement d’un site dans un moteur de recherche est un indicateur de qualité parmi d’autres. Ce placement ne peut pas être contrôlé, et ne dépend pas uniquement du site concerné — il est toujours relatif au reste du matériel existant sur internet.

Il est bien plus efficace d’agir sur le contenu et la qualité formelle d’un site afin de l’améliorer plutôt que de chercher à obtenir directement un résultat en termes de placement par rapport à certains mots-clés, objectif qui est souvient peu réaliste.

Notes

  1. La plupart des moteurs de recherche fonctionnent sur le modèle de Google. Si ce document parle des moteurs de recherche en général, c’est plus particulièrement de Google et des moteurs de recherche fonctionnant sur des principes similaires dont il s’agit ici.
  2. Les organisations qui garantissent un placement dans les x premiers résultats pour tel ou tel mot-clé utilisent des techniques peu éthiques qui reviennent en somme à tricher avec les algorithmes de classement des moteurs de recherche []. D’un moyen pour mesurer quelque chose (la qualité), le placement devient un but en soi.
  3. Google tient en effet également compte des mots utilisés pour créer des liens vers une page donnée. Le “googlebombing” abuse de ce fait pour imposer une page spécifique en première position lorsqu’on l’on recherche certains mots-clés, en obtenant qu’un grand nombre de sites Web utilisent ceux-ci dans le texte de liens pointant vers cette page. Un exemple célèbre plaçait la biographie officielle de George Bush en première position des résultats lorsque l’on cherchait l’expression “miserable failure”, même si la page ne contenait bien sûr pas cette expression. Voir aussi .
  4. Ces fameux mots-clés, importants pour les moteurs de recherche de la génération précédant Google, sont ceux que l’on place dans la balise HTML .
  5. Le PageRank est une valeur allant de 0 à 10 et qui est basée sur le nombre de liens entrants vers une page, pondérée par la valeur de PageRank de la page sur laquelle se trouve ce lien.

A lire aussi, en anglais: Matt Cutts: Whitehat SEO Tips For Bloggers, les notes que j’ai prises lors de sa conférence à WordCamp (San Francisco).