Trying Dictation Software [en]

If, like Samuel, you are tempted to try Dragon NaturallySpeaking, you need to be aware of the following.

You did not become as proficient as you are now with your keyboard and mouse in a few weeks. It probably took you years. With proper equipment and practice, speech recognition can be more efficient than traditional ways of controlling your computer. When you start using dictation software, however, it feels a bit like learning to use your computer all over again — especially the “controlling” part. Straightforward dictation itself is pretty easy to grasp, and you quickly find that editing a text is much nicer to do when you can just say things like “insert before this or that word”, “select previous five lines”, or “move down two paragraphs”. Dictation itself is much quicker than typing. Corrections take time, therefore the better your recognition accuracy, the more efficient you will find your dictation program.

I can only encourage you to try before you really need it. It works, it’s fun, and it will certainly save you time and pain in the long run. Learning does not go without frustrations. You’ll have trouble using it in the beginning, especially when giving commands to your computer. Do not expect to install speech recognition and be as efficient with it with it as you are with your keyboard and mouse within two days, two weeks, or even two months, probably. If you are aware that you are going to have to learn a whole different way of interacting with your computer, you’ll actually be surprised at how reasonably painless it is.

Within a couple of hours, I was capable of dictating an e-mail with a reasonable number of corrections. A few days later, I was chatting by voice with enough ease that the people I was talking with were not immediately aware that I was dictating. Today, 10 days after installing the programme, I’m comfortable dictating, but still pretty clumsy and slow giving commands or doing HTML other than “open p” and “insert link”. But it’s getting better.

I don’t want to paint the picture black, but I don’t want to paint it too pink either. It is not overwhelmingly difficult. But it is not that easy either. It’s worth the effort, and you get well paid for your efforts, but it does require perseverance on your part. I was honestly expecting it to be more difficult, because I had been warned so much not to expect it to be straightforward.

Dicter avec le Dragon [en]

Je suis vannée. Je ne sais pas trop s’il faut mettre ça sur le compte du passage à  l’heure d’été, ou bien si c’est simplement la faute au stress et à  l’inquiétude ambiante. Un meeting un peu léthargique de quatre à  six n’a certainement aidé en rien. Mais bon, trêve de futilités : cela fait un moment que je veux vous raconter un peu plus précisément comment cela se passe quand on parle à  son ordinateur — comme par exemple maintenant pour écrire ceci.

Pour commencer, on dicte. Avec les signes de ponctuation, et en essayant de dire des assez gros bouts de phrase d’une traite, parce que le Dragon aime bien avoir un peu de contexte pour tenter de deviner ce qu’on dit. Si par malchance le Dragon a compris quelque chose de travers, on utilise la formule magique « corriger ça » pour faire apparaître d’autres possibilités. Ça marche un peu comme le correcteur orthographique dans Word, mais c’est plus sympa.

À l’énonciation de la formule magique précitée, une boîte de dialogue apparaît au milieu de l’écran : elle comporte en général une dizaine de suggestions pour la portion de phrase que l’on vient de dire. Le Dragon utilise un modèle phonétique et un modèle statistique pour générer ses suggestions.

Le modèle phonétique essaie d’accorder les sons que l’on produit avec la « signature vocale » des mots se trouvant dans le vocabulaire.

Prenant ensuite le relais, le modèle statistique sert à  choisir entre les diverses possibilités en fonction de la fréquence d’utilisation des mots, et en fonction de la fréquence avec laquelle des mots donnés se retrouvent proches les uns des autres (c’est la fameuse histoire du « contexte »).

Ces deux modèles prennent bien sûr en compte les particularités de l’utilisateur en question, et s’adaptent sans cesse à  son style.

Tout ça pour vous dire que lorsque l’on dit « corriger ça », une boîte pleine d’autres possibilités pour ce que l’on vient de dire apparaît à  l’écran. Très souvent, la phrase que l’on a réellement dite se trouve parmi ces suggestions. Il suffit alors de dire « prendre 4 », par exemple, pour choisir la quatrième suggestion. Le Dragon sauvegarde précieusement les informations concernant cette erreur pour faire mieux la prochaine fois.

Bien sûr, il arrive que la phrase que l’on a dite ne figure pas parmi les propositions. On peut alors sélectionner la proposition qui s’en rapproche le plus et l’éditer — tout ça sans les mains, bien sûr. Je vous passe les règles avancées, mais avec un peu de pratique il est relativement aisé de se déplacer de quelques caractères ou mots à  gauche et à  droite, de les effacer, de les redicter ou les épeler. Bien sûr, il est à  tout moment possible de rejouer ce que l’on vient de dire.

La suite au prochain épisode, si ça vous intéresse ! Mon lit m’appelle à  grand cris…

Troubles musculo-squelettiques [en]

Troubles musculo-squelettiques : c’est ainsi que l’on appelle en français les Repetitive Strain Injuries (RSI). On est en plus heureux d’apprendre ceci :

La nouvelle maladie qui fait actuellement rage se nomme TMS « Troubles Musculo-Squelettiques. » Il s’agit d’affections douloureuses – non reconnues en Suisse comme maladie professionnelle – touchant les articulations, les tendons, les muscles, les nerfs et la circulation. Elles touchent particulièrement le dos et les membres supérieures. J’observe donc avec une certaine inquiétude que ces troubles dont souffrent les patients pourraient être liés à  de mauvaises conditions de travail. […] Comme Conseiller d’Etat responsable de la santé publique, j’ai par ailleurs donné mandat à  l’Institut Universitaire Romand de Santé au Travail de mener une étude prospective auprès des médecins du canton afin de recueillir les données de patients qui se plaignent de problème de santé lié au travail.

Thomas Burgener (je souligne)

Soit dit en passant, je ne félicite pas le webmaster de cette page pour le Javascript qui la ferme automatiquement lorsque l’on appuie sur une touche quelconque. Je lui décerne donc un cactus pour l’accessibilité !

Lost My ICQ Contacts [en]

For some unknown reason (probably one of the numerous system crashes during the last week) I have lost all my ICQ contacts. If you have me on your ICQ list, please send me a message so that I can add you again.

Pensées d'automne [en]

L’automne nous fait la grâce d’une magnifique journée ensoleillée. Il fait doux, et un vent léger mais présent agite les arbres multicolores.

J’ai un petit mal de gorge depuis quelques jours. Trop de dictée, certes, mais j’ai de façon facilement mal à  la gorge. L’ORL dit que ce n’est pas normal et veut me mettre de la cortisone dans le nez pour régler ça. Je ne suis pas trop enthousiaste pour la cortisone.

Je me suis réveillée ce matin avec un puissant mal de crâne. J’ai très rarement mal à  la tête. Comme toujours lorsque cela m’arrive, je pense à  la méningite. Ça me fait flipper, la méningite, comme tous ces trucs qui vous envoient manger les pissenlits par la racine en moins de vingt-quatre heures sans crier gare. Mais bon. Il y a quand même toutes les chances que je sois encore vivante demain.

Depuis que je dicte, je me surprends à  vouloir parler de choses différentes. Ce weblog n’a jamais été un journal. Ceux qui me connaissent savent que je parle facilement de moi — un peu trop facilement, peut-être. C’est comme si maintenant que je dicte mes billets, au lieu de les écrire, j’avais plus impression de parler à  mes lecteurs. J’ai plus envie de me raconter, et de raconter le monde autour de moi.

Death of Richard Harris [en]

Richard Harris died this evening in London, aged 72. For many, he is better known as Professor Dumbledore in Harry Potter.

[The Leaky Cauldron]

A Day at Work [en]

Orange Switzerland launched MMS yesterday. As MMS gets popular, we’ll start seeing more phones like the Nokia 7650. Here is what happens when your colleagues have this kind of toy:

Stephanie waving pens at her colleagues while facilitating a decision analysis exercise.

Here I am, in the middle of a team meeting, facilitating a decision analysis exercise. My colleague Stefan whips out his phone, pulls it open, and clicks. I barely have time to protest.

Thanks for the photograph, by the way!

TypeAhead Is Great! [en]

Thanks to Jemisa, I have now downloaded Mozilla version 1.2b and I am happily browsing web pages using the TypeAhead functionality.

This makes it a good bit better than what I said in my last post. I’m glad it’s not as bad as I thought!

Accessibility: People Who Command Their Computer by Speech [en]

Creating a new weblog post is pretty painless. I have a dictation shortcut which inserts the markup and placeholders for text and title. Let me know if I start flooding you.

Mozilla seems to lack accessibility components (MSAA) included in Internet Explorer and other Microsoft programs, which make them easier to use by voice. With Internet Explorer for example, a hyperlink is automatically selected when you pronounce the hyperlink text, so that you can follow it. In Mozilla, I have to tab my way around or hope that the site I’m visiting has provided access keys for each hyperlink (is that even possible?)

More on this topic once I have figured it out.

Update 31.10.02: actually, Mozilla has top-notch support for MSAA, but Dragon doesn’t activate it. What a pity!

Misrecognitions: the Joys of Speech Recognition [en]

If keyboards tend to produce typos, speech recognition introduces one to the world of misrecognitions. As they are not misspelt words, they tend to escape the eye, often producing comical or embarrassing results.