Trying Dictation Software [en]

If, like Samuel, you are tempted to try Dragon NaturallySpeaking, you need to be aware of the following.

You did not become as proficient as you are now with your keyboard and mouse in a few weeks. It probably took you years. With proper equipment and practice, speech recognition can be more efficient than traditional ways of controlling your computer. When you start using dictation software, however, it feels a bit like learning to use your computer all over again — especially the “controlling” part. Straightforward dictation itself is pretty easy to grasp, and you quickly find that editing a text is much nicer to do when you can just say things like “insert before this or that word”, “select previous five lines”, or “move down two paragraphs”. Dictation itself is much quicker than typing. Corrections take time, therefore the better your recognition accuracy, the more efficient you will find your dictation program.

I can only encourage you to try before you really need it. It works, it’s fun, and it will certainly save you time and pain in the long run. Learning does not go without frustrations. You’ll have trouble using it in the beginning, especially when giving commands to your computer. Do not expect to install speech recognition and be as efficient with it with it as you are with your keyboard and mouse within two days, two weeks, or even two months, probably. If you are aware that you are going to have to learn a whole different way of interacting with your computer, you’ll actually be surprised at how reasonably painless it is.

Within a couple of hours, I was capable of dictating an e-mail with a reasonable number of corrections. A few days later, I was chatting by voice with enough ease that the people I was talking with were not immediately aware that I was dictating. Today, 10 days after installing the programme, I’m comfortable dictating, but still pretty clumsy and slow giving commands or doing HTML other than “open p” and “insert link”. But it’s getting better.

I don’t want to paint the picture black, but I don’t want to paint it too pink either. It is not overwhelmingly difficult. But it is not that easy either. It’s worth the effort, and you get well paid for your efforts, but it does require perseverance on your part. I was honestly expecting it to be more difficult, because I had been warned so much not to expect it to be straightforward.

Dicter avec le Dragon [en]

Je suis vannée. Je ne sais pas trop s’il faut mettre ça sur le compte du passage à  l’heure d’été, ou bien si c’est simplement la faute au stress et à  l’inquiétude ambiante. Un meeting un peu léthargique de quatre à  six n’a certainement aidé en rien. Mais bon, trêve de futilités : cela fait un moment que je veux vous raconter un peu plus précisément comment cela se passe quand on parle à  son ordinateur — comme par exemple maintenant pour écrire ceci.

Pour commencer, on dicte. Avec les signes de ponctuation, et en essayant de dire des assez gros bouts de phrase d’une traite, parce que le Dragon aime bien avoir un peu de contexte pour tenter de deviner ce qu’on dit. Si par malchance le Dragon a compris quelque chose de travers, on utilise la formule magique « corriger ça » pour faire apparaître d’autres possibilités. Ça marche un peu comme le correcteur orthographique dans Word, mais c’est plus sympa.

À l’énonciation de la formule magique précitée, une boîte de dialogue apparaît au milieu de l’écran : elle comporte en général une dizaine de suggestions pour la portion de phrase que l’on vient de dire. Le Dragon utilise un modèle phonétique et un modèle statistique pour générer ses suggestions.

Le modèle phonétique essaie d’accorder les sons que l’on produit avec la « signature vocale » des mots se trouvant dans le vocabulaire.

Prenant ensuite le relais, le modèle statistique sert à  choisir entre les diverses possibilités en fonction de la fréquence d’utilisation des mots, et en fonction de la fréquence avec laquelle des mots donnés se retrouvent proches les uns des autres (c’est la fameuse histoire du « contexte »).

Ces deux modèles prennent bien sûr en compte les particularités de l’utilisateur en question, et s’adaptent sans cesse à  son style.

Tout ça pour vous dire que lorsque l’on dit « corriger ça », une boîte pleine d’autres possibilités pour ce que l’on vient de dire apparaît à  l’écran. Très souvent, la phrase que l’on a réellement dite se trouve parmi ces suggestions. Il suffit alors de dire « prendre 4 », par exemple, pour choisir la quatrième suggestion. Le Dragon sauvegarde précieusement les informations concernant cette erreur pour faire mieux la prochaine fois.

Bien sûr, il arrive que la phrase que l’on a dite ne figure pas parmi les propositions. On peut alors sélectionner la proposition qui s’en rapproche le plus et l’éditer — tout ça sans les mains, bien sûr. Je vous passe les règles avancées, mais avec un peu de pratique il est relativement aisé de se déplacer de quelques caractères ou mots à  gauche et à  droite, de les effacer, de les redicter ou les épeler. Bien sûr, il est à  tout moment possible de rejouer ce que l’on vient de dire.

La suite au prochain épisode, si ça vous intéresse ! Mon lit m’appelle à  grand cris…

Death of Richard Harris [en]

Richard Harris died this evening in London, aged 72. For many, he is better known as Professor Dumbledore in Harry Potter.

[The Leaky Cauldron]

TypeAhead Is Great! [en]

Thanks to Jemisa, I have now downloaded Mozilla version 1.2b and I am happily browsing web pages using the TypeAhead functionality.

This makes it a good bit better than what I said in my last post. I’m glad it’s not as bad as I thought!

Misrecognitions: the Joys of Speech Recognition [en]

If keyboards tend to produce typos, speech recognition introduces one to the world of misrecognitions. As they are not misspelt words, they tend to escape the eye, often producing comical or embarrassing results.

Je parle à  mon ordinateur… [en]

Depuis hier après-midi, je parle à  mon ordinateur. Le programme que j’ai acheté, Dragon NaturallySpeaking, marche plutôt bien. La preuve, je suis en train de dicter ce texte.

Je trouve épuisant d’apprendre à  parler à  mon ordinateur. Il ne s’agit pas simplement d’apprendre de nouvelles commandes. C’est un mode d’intéraction tout à  fait différent, qui mobilise certainement une autre partie de mon cerveau. Le rapport que l’on a avec son ordinateur au travers de la souris est kinésthesique. La souris et le clavier mettent en jeux une mémoire du mouvement, même si ce mouvement, en ce qui concerne la souris, a lieu en partie à  l’intérieur de l’écran, dans un espace virtuel. Lorsque l’on commande son ordinateur par la voix, par contre, ce sont les compétences linguistiques qui se mettent en marche.

Je suis toute maladroite avec ma machine. Déplacer la souris prend des siècles. Je prononce une commande, et des choses inattendues se passent. Je me dis que les personnes qui commencent à  utiliser un ordinateur doivent ressentir quelque chose de similaire. Du coup, j’ai beaucoup moins envie d’utiliser mon ordinateur. Je n’y suis plus comme un poisson dans l’eau. Un peu comme ce week-end, lorsque j’ai essayé pour la première fois des rollers inline —que je n’étais pas aussi à  l’aise que sur des skis

Dicter et taper sont aussi deux choses assez différentes. Merleau-Ponty a parlé de « penser en peinture », ou de « penser en écriture ». Ce n’est pas la même chose de penser en écriture ou de penser en mots prononcés. Est-ce que mon style d’écriture va changer ? J’ai tellement l’habitude de voir les mots passer directement de mon cerveau à  l’écran, comme ça, sans effort. Ça fait bizarre de parler. Dolores, tu vas être contente : maintenant j’ai des guillemets français et des espaces avant mes points d’interrogation !

Bon, je vois que je commence à  tartiner. Les hyperliens et les détails sur la reconnaissance vocale, ça sera pour la prochaine fois.

J’ai malheureusement perdu tous mes contacts ICQ. Envoyez-moi un petit message pour que je puisse vous rajouter, si jamais !

Opposed to the War on Terror [en]

We won’t deny our consciences

Let it not be said that people in the United States did nothing when their government declared a war without limit and instituted stark new measures of repression. [more]

The Guardian, June 14, 2002

This statement was signed by prominent americans and published in June. 4000 more signatures have been added since then. It’s worth reading.

This was cited in a swiss newspaper that I read yesterday, which explains why I’m noting it now, so long after it was published.

Entre gris clair et gris foncé… [en]

…il n’y a parfois même pas un poil.

Illusion d’optique: un carré clair de l’échiquer dans l’ombre est du même gris qu’un carré foncé hors de celle-ci. Flippant, non?

[Vu sur garoo.net.]

Voice Recognition [en]

Here is a very interesting talk on controlling computers by speech using voice recognition software.

This is certainly the way I’ll be heading if my wrists don’t get better very soon (I’m seeing the doctor on Tuesday). By the way, this accounts for part of my silence — he other part is to blame on my exams (yes, the first one went well, thank you!)

Tech Support Nightmare [en]

A happy episode of the Hard Disk Saga (for once) is one of these fun tech support stories you find on geek websites. Enjoy.

[Link grabbed from Tidak ada.]