Les Windows Phone 7 seront bavards ou ne seront pas

Anthony Nelzin-Santos |

Lors de la conférence SpeechTEK 2010, Microsoft a fait la démonstration des fonctions de reconnaissance vocale de Windows Phone 7. Pour Zig Serafin, en charge de ce projet, « la reconnaissance vocale n'est pas une application séparée [mais] plutôt partie intégrante de l'expérience utilisateur ».

Il a commencé par fustiger l'approche de Google et d'Apple, qui utilisent les icônes comme élément principal d'interface : « la plupart des smartphones utilisent des grilles d'icônes, comme Windows 3.1 ». Il est vrai que Windows Phone 7 s'éloigne de cette métaphore au profit d'une interface assumant clairement le numérique, ne cherchant pas à imiter le réel, mais utilisant la typographie comme structure principale (lire : Interface iPad : Apple se trompe-t-elle ?).

« Quand vous passez à un appareil qui n'a pas un grand clavier, la voix est un complément attrayant », explique-t-il, reprenant et développant l'idée fixe de Bill Gates sur le couple tactile/voix, à l'époque pour les TabletPCs. La reconnaissance vocale est ainsi partie prenante des NUI, les natural user interfaces ou « interfaces utilisateurs naturelles ». Si sur Windows Phone 7, ces NUI sont le tactile et la voix, c'est plutôt l'utilisation de gestes captés par un module Kinect en plus de la voix qui pourront permettre à l'utilisateur d'interagir avec sa XBox, par exemple.

Le directeur marketing de Microsoft Ilya Bukshsteyn a fait la démonstration de quelques commandes vocales : alors que la reconnaissance vocale d'iOS se limite à l'appel et au pilotage de la musique et que celle d'Android est principalement utilisée pour la recherche, celle de Windows Phone 7 veut couvrir tous les aspects du système, le but étant, à terme, de pouvoir piloter toute l'interface à la voix avec du langage naturel.

Bukshsteyn a commencé par une fonction classique, l'appel, pour démontrer les fonctions interactives de ce système : en demandant d'appeler « Paul », le téléphone lui a répondu qu'il connaissait plusieurs « Paul ». Il a alors donné la liste, et Bukshsteyn a pu répondre en donnant le bon nom de famille.

Bukshsteyn a ensuite montré le pilotage de l'interface, lançant l'application Photos par la voix. Enfin, il a montré l'intégration de la reconnaissance vocale au moteur décisionnel Bing : il a demandé un restaurant chinois, et le téléphone a lancé l'interface de recherche locale, affichant les restaurants chinois autour de Bukshsteyn.

Microsoft a acquis les technologies de Tellme Networks en 2007 pour développer cette fonction. Les services de Tellme sont les services les plus utilisés aujourd'hui, notamment dans le domaine des serveurs vocaux, où ils sont utilisés pour répondre à 2,5 milliards d'appels. Dans un premier temps, la reconnaissance vocale se limitera à la recherche, l'appel, et la navigation dans les photos, et sera augmentée au fur et à mesure.

Une partie de la reconnaissance sera faite par le téléphone, qui utilisera certainement un processeur spécifique comme le fait l'iPhone, et une partie sera faite sur les serveurs de Tellme, à la manière de la reconnaissance vocale de Google.

avatar justmoot | 
coucou...
avatar BeePotato | 
« la plupart des smartphones utilisent des grilles d'icônes, comme Windows 3.1 ». Alors que Windows 7 mobile n'utilisera quasiment que du texte, comme MS-DOS. "Find chinese restaurants - Sorry, didn't catch that" ça promet...
avatar kikfaf | 
Parce que Microsoft croit sérieusement que les gens vont se servir de la reconnaissance vocale ??? Impossible de s'en servir discrètement ( transports en commun, bureau... ) Hyper lent... A mon avis Microsoft fait complètement fausse route...
avatar netgui | 
Ça a l'air assez séduisant comme ça mais après, c'est toujours pareil avec MS, que va t'il en rester réellement dans les produits ?
avatar freelancer007 | 
Je deteste ces techno de reconnaissance vocale...J'en ai toujours eu autour de moi (gps, mobile, etc) et je n'ai jamais utilisé, trop perfectible, trop gadget et finalement, pas plus rapide qu'un clic.
avatar Djipsy5 | 
ça veut dire que cet OS ne sera disponible qu'aux Etats-Unis ? parce que la reconnaissance vocale dans d'autres langues, c'est la catastrophe... comme la reconnaissance d'écriture d'ailleurs.
avatar Dan DT | 
Sur certains Tableaux Blancs Interactifs, utilisés pour l'enseignement, la reconnaissance d'écriture est fonctionnelle à 99 %, que le tableau soit piloté par un PC ou un Mac.
avatar batou160 | 
@ KhrisK : Oui mais le soucis c'est que souvent dans ce genre de procèder c'est plus des technos propriétaire rajouter comme un logiciel et non comme une couche de l'OS ou n'importe quel dev pourrait prendre pour son application. Donc du coup oui Apple et Crosoft on bien ce genre d'outils dans leur boîte à outils mais bien moins performante qu'une petite entreprise qui le fait que çà depuis 10 ans. Alors du coup pour gagner du temps ces mêmes petite entreprises se font racheter par rachat ciblé par des gros comme Apple ou Crosoft mais le plus souvent par Google pour ces futurs produits. Car Apple et MSFT ayant plus une attitude d'incubateurs que l'autre nul de Mountain View.
avatar an3k | 
Je trouve que la reconnaissance vocale en Français qui est intégrée à Android fonctionne plutôt bien. J'ai réussi à dicter des sms sans erreurs (dans un environnement calme). A part le côté ridicule de la chose, ça marche. Ce qui est vraiment surprenant, c'est qu'il est inutile de laisser des blancs entre les mots.
avatar Dawar | 
Utiliser ça dans la rue et dans le bruit c'est pas très pratique et puis on a pas l'air bête et tout le monde sait ce que l'on fait ! Et qui s'en sert sur l'iPhone ? Pas moi en tout les cas. C'est quand qu'ils inventeront la reconnaissance télépathique ?? Parce que je dirais oui de suite !
avatar gilzecat | 
Ça va être sympa la nuit quand on veut tuer le temps (de l'insomnie) et que l'on va devoir réveiller ça compagne pour pouvoir juste ouvrir un menu de son tel xD. Ils ne sont vraiment pas sérieux...
avatar Hi me | 
Moi je me sers pas mal de la reconnaissance vocale de l'iPhone en voiture. Mais dans la rue c'est juste pas possible. Moi ma blague préférée c'est de crier "effacer" aux gens qui s'excitent sur leur messagerie vocale à contrôle vocal
avatar Thunderfury | 
Sans compter un "léger" détail: la localisation qui implique de réécrire entièrement d'énormes pans de l'interface pour décoder qui le mandarin, qui l'espagnol, qui le catalan, qui l'idiome des indigènes de l'hexagone...
avatar batou160 | 
Moi ce n'est pas microdaube qui me fait rire mais les commentaires. Chez certains leur niveau d'humour est top je me suis bien marrer sur Youporn ou sur l'insomnie, il m'arrive de la réveiller sur l'iphone avec safari ouvert sur une page blange en pleine nuit sa pète et ma copine aussi pète un cable. En revenant au système de reconaissance vocale, je pense que Microsoft veut juste mettre en avant un point fort de leur OS qui sur ce point de vue est supérieur à iOS, mais bon entres quatre années de développement d'un côté et les retours d'expérience utilisateurs et là un tout nouvel OS et bien je dis bonne chance aux devs de Redmond, mais bon ils ont déjà vu pire avec l'épisode du Sp2 de Xp.
avatar JonathanMds | 
Cet OS ressemble de plus en plus a une farce .... Autant j'aime bien leur interface, autant ils partent en live de façon sévère !
avatar Jacti | 
Oui je plussoie les commentaires sur la reconnaissance vocale. Je l'ai utilisée 2-3 fois sur mon iPhone pour tester mais jamais pour de vrai.
avatar eipem | 
Mouarf, la reconnaissance vocale comme solution ultime! Déjà qu'on a l'air con quand on parle à son kit main libre dans la rue (ça nous est tous arrivé de répondre à un coup de téléphone alors qu'on écoutait tranquillement de la zic), mais alors là ça va carrément être n'importe quoi! J'imagine pas le bordel dans les transports en commun ou au cinéma. 200 zozos qui commandent tous en chœur "activer mode avion" ou "activer mode silencieux". C'est à croire que les ingénieurs de chez M$ ne sortent jamais IRL. En fait ça me fait penser au roman Microserfs qui raconte dans le détail la vie de ses ingés dans la silicon valley. Je le conseille au passage. Je crois que la reconnaissance vocale est un mythe de l'informatique aussi absurde que la voiture volante. On a envie d'en avoir l'utilité, mais y a rien à faire, ça sert à rien la plupart du temps, et c'est une catastrophe au niveau pompage de ressources/énergie. J'ai téléchargé l'appli "Google" qui permet la recherche vocale, pour montrer à un type d'une mauvaise foi absolue que l'iPhone était parfaitement capable de faire de la reconnaissance vocale. J'ai trouvé ça marrant deux fois. Je ne m'en sers jamais. D'ailleurs je la supprime de suite.
avatar Lio70 | 
Wai, alors si pour toi utiliser son kit main libre c'est avoir l'air con, ben dis donc. C'est fait entre autre pour ne pas se coller le téléphone à l'oreille et donc près du cerveau. Par contre je suis d'accord que c'est risible et totalement gagdget de parler à son téléphone pour changer ses réglages, faire une recherche internet etc. Vive la discrétion, et tout le monde n'est pas obligé de subir la vie privée des gens. Déjà que de jeunes généreux veulent absolument nous faire écouter leur musique délivré par les enceintes pourries de leur portable, alors si en plus faut qu'on sache qu'il veulent aller au McDo, non merci.
avatar Franckytoo | 
@ Dagui : Et vas parler à ton téléphone quand de jeunes généreux mettent leur musique sur portable à fond. Et Microsoft qui se permet de donner des leçons à Apple question interface on croit rêver ! Avant de parler on voudrait voir concrètement comment tout ça se casse la gu.... euh tient debout ! C'est toujours pareil avec Microsoft ils parlent de leur prototypes mais jamais de la réalité… ex le kin et bientôt kinnect.
avatar mixo001 | 
je trouve qu'il y a beaucoup de gens qui sont de mauvaise foi ici autant je déteste l'interface de windows phone 7, autant la reconnaissance vocale peut être utile quand on est seul et qu'on a pas envie de se compliquer la vie à écrire un sms/mail par contre c'est plutôt imprécis, le mec prononce naturellement chinese retaurent et il est obligé de le répéter pour que ça marche, faudrait que ça marche parfaitement
avatar STi_wings | 
iNabil : ils ont tout à fait raison pour la reconnaissance vocale, ce n'est pas de la mauvaise foi. Déjà, seul un très faible pourcentage de gens utilisera cette fonction. Et dans ce pourcentage, il faudra que leur environnement réunisse des conditions de calme et de tranquillité pour ne pas perturber la voix. Donc de ce côté-là, c'est zéro. Par contre, ne pas confondre ce développement absolument ridicule avec l'OS et/ou le téléphone entier : le pilotage par la voix ne sera qu'une option, le tactile sera bien présent.
avatar Switcher | 
L'utilisateur : "j'ai envie de me faire un chinois" Windows Phone 7 : "Vous avez un vendeur de battes de baseball à 300 mètres sur votre droite" - "Non, je veux me faire un RESTAU chinois" - "Vous avez un vendeur d'engins de travaux publics à 200 mètres sur votre gauche" - "Je veux MAN-GER" ...
avatar Hi me | 
Ah Ah Ah ! Mec tu m'as tué !
avatar Hoks | 
J'ai vu qu'il était possible via jailbreak d'avoir le contrôle vocale sur l'iPad, perso, je trouve que c'est pratique lorsque l'on cuisine et que l'on a les mains prisent et je suis sûr qu'il peut avoir d'autres cas intéressant.. par exemple en domotique, ça peut être sympa! Évidemment ça reste des environnements calmes et je doute fortement de l'intérêt sur un téléphone mobile, mais sait on jamais..
avatar Schlurf | 
Apple a certainement aussi des technos prêtes pour OSX mais à la différence de $oft, son goût du travail bien fait l'empêchera de sortir un produit non abouti.
avatar justhouz | 
Super les commentaires, on dirait des Unixiens qui pestifèrent l'interface graphique parce que c'est mille fois plus rapide de taper de la ligne de commande que de bouger sa main et piloter à la souris ... L'avenir les mecs, Microsoft essai de faire quelque chose, le marché décidera, depuis que j'ai découvert VoiceOver sur mon iPhone qui le prend en compte je suis bouche bée, ça rejoint sans doute des travaux de MS sur la domotique :)
avatar whocancatchme | 
La RV est une fonctionnalité comme une autre qui peut intéresser certaines personnes dans certaines conditions mais paraît soumise à trop de paramètres aléatoires (bruits, rhume, humeur, etc.) pour être réellement efficiente. Sans compter l'air idiot de hurler des ordres en public à un bigophone récalcitrant... L'installer comme fonction de base prouve une fois de plus que MS, au delà de frimer avec une technologie de niche, est hors de la réalité, de l'évolution logique des utilisations mobiles, chose qu'a parfaitement « imaginé » Steve Jobs.
avatar methos1435 | 
Ils jouent l'épate. Il semblerait que ca marche au moins un peu. Dans les faits, si demain toutes les interactions device mobile se gèrent à la voix ca va être un sacré bordel. Et je parle pas de la discrétion nécessaire de certaines communications. C'est d'ailleurs marrant tout ca, dans le fond, on voit Facebook nier le partage public/privé, pro/perso etc. et on est capable d'envisager des interactions complexes sur des tâches extrêmement variées en en faisant profiter tout le monde autour. Il y a une naïveté commune. Alors que de son côté, Saint Jobs nous protège – fort heureusement déjà – de la lubricité de l'époque, mon voisin de table devrait m'expliquer à haute voix ce qu'il demande à sa copine de porter quand il rentrera après la réunion ?
avatar justhouz | 
Ça vous arrive jamais de tenir une conversation au téléphone dans la rue ? Personne ne traverse votre chemin a ce moment !? Vous ne parlez qu'à votre boulot et chez vous et jamais en dehors !? Vous surveillez le moindre verbe lancé en public ???
avatar Madmac | 
La vache ... vous faites exprès , c'est pas possible d'être aussi malhonnête Ça me rappelle l'époque ou tous les nouveaux tels sortaient avec une camera de façade pour faire de la Visio , et la tout le monde disait que c'était pourri , Apple le fait et lui donne un nouveau non et là ,tout le monde dit :" oh , mais c'est génial". Bien sur que c'est pas a utiliser n'importe ou , comme face time ,je ne me vois pas faire du face time dans la rue ou dans le métro avec ma petite copine ... Arrêtez la mauvaise fois Merci

CONNEXION UTILISATEUR