Assistant iOS 5 : « un événement qui change tout »

Anthony Nelzin-Santos |

9to5 Mac a eu l'occasion d'interroger Norman Winarsky, vice-président de SRI Ventures et investisseur dans Siri, cette société ayant conçu un assistant vocal achetée par Apple en mai 2010. La rumeur veut que cette technologie soit intégrée dans iOS 5 sous la forme d'un « Assistant », un système très avancé de commandes vocales. Pour Winarsky aucun doute : cette intégration sera « un événement qui change tout ».

Apple fait partie de la poignée de sociétés qui ont défini les contours de la micro-informatique. Elle a par exemple participé à l'émergence de l'ordinateur personnel en achetant les travaux du PARC de Xerox et en s'en servant comme base pour l'interface du Lisa (lire : Le Lisa souffle ses bougies), en inventant des métaphores aujourd'hui communes (la barre de menu, les menus déroulants, le copier-coller ou la corbeille), et en prenant une licence sur les travaux de Douglas Engelbart et en transformant sa souris en un objet fiable et productible en grande série (lire : Une vieille histoire de rongeur). Plus récemment, elle a permis aux technologies tactiles multi-point de sortir des labos et a mis au point un dictionnaire de gestuelles devenu la lingua franca du domaine.

skitched

Apple s'est par contre tenu à l'écart d'un champ pourtant dynamique, celui de l'interaction vocale, tout comme elle a sciemment ignoré le champ de l'interaction au stylet. La voix est pourtant, avec la manipulation tactile, une des pierres angulaires des interfaces utilisateur « naturelles ». C'est une passion de Bill Gates, et un axe de recherche important pour Microsoft, qui s'est notamment porté acquéreur de TellMe, une société dont les technologies sont à la base du système de reconnaissance vocale de Windows Phone 7. Dans Android, Google dispose de son propre système de reconnaissance vocale, qui utilise les serveurs de la firme de Mountain View pour déchiffrer la question posée et calculer une réponse pertinente.

L'acquisition de Siri par Apple a naturellement posé des questions : c'était le premier pas de la firme de Cupertino dans la direction du développement d'une interface vocale. Siri a été fondée en 2007 au sein de SRI à partir des connaissances acquises lors du développement du programme CALO du DARPA, l'agence du ministère américain de la Défense qui a permis le développement du radar, d'ARPANET (l'ancêtre d'Internet), de l'hypertexte ou du GPS. Le but de CALO était de créer une intelligence artificielle qui soit un assistant personnel capable d'apprendre et qui puisse être commandé à la voix. Des technologies dont l'application commerciale était évidente : après trois ans de travail et deux mois seulement après la sortie de son application iOS, Siri est achetée par Apple, pour une somme estimée à 200 millions de dollars.

skitched

Fait rare pour être remarqué : les trois co-fondateurs de Siri sont encore aujourd'hui chez Apple.

Winarsky s'exprime comme quelqu'un connaissant bien le potentiel des technologies de Siri, même s'il est resté chez SRI. Il ne fait presque aucun doute qu'Apple a pris une licence sur les technologies de Nuance, un des meilleurs spécialistes de la reconnaissance vocale. Son moteur servirait aujourd'hui de base aux technologies de Siri. Siri est un assistant personnel, un moteur de recherche intelligent à qui l'on pose une question en langage courant, question que reformule et interprète Siri, qui vous donne ensuite la réponse sous la forme de résultats. Si on lui dit « je cherche un restaurant italien romantique à côté du boulot », le système vous donnera une liste des restaurants italiens dont les critiques mentionnent que leur ambiance est romantique et qui sont situés à proximité de votre lieu de travail. Vous pouvez ensuite lui demander de faire une réservation à un des restaurants de la liste. Mieux encore : si vous cherchez alors une séance pour la comédie romantique de la semaine, Siri vous donnera alors les séances dans les salles de cinéma à proximité du restaurant italien sélectionné plus tôt.

Comme le fait remarquer Winarsky, ce système est gourmand en ressources : la reconnaissance vocale nécessite un processeur de signal numérique spécifique, et le calcul des résultats nécessite une grande puissance pour analyser les données. Un iPhone de nouvelle génération ne serait donc pas de trop. Winarsky insiste sur le fait qu'il n'a aucune connaissance des intentions d'Apple, mais que les indices laissés dans les versions de développement d'iOS 5 tendent à montrer que la présentation d'un Assistant basé sur les technologies de Siri est imminente.

L'implémentation de ces technologies est sans aucun doute, selon lui, de portée à « tout changer » : « Siri était à des années-lumière devant [les technologies de Google et Nuance], ou au moins l'était-il il y a deux ans. […] Si ces rumeurs sont vraies, Apple va permettre à des millions et des millions de personnes d'interagir avec les machines à l'aide du langage naturel. […] On parle d'une nouvelle révolution technologique. Un nouveau changement de paradigme informatique. Cela me rappelle un autre projet du SRI, celui de Doug Engelbart, l'inventeur de la souris dans les années 60. De la même manière que Steve Jobs s'est emparé de cette technologie, nous pensons qu'Apple va utiliser Siri pour initier une nouvelle révolution ». Une nouvelle « révolution » qui rappelle le Knowledge Navigator, un assistant personnel informatique imaginé par Apple… en 1987 (lire : Une petite histoire de l'iPad).


avatar Nkz | 
Apple va encore frapper fort en rendant un service vu, et revu (mais non utilisé) utilisable et utilisé par des millions de personnes ! Merci iG pour ce très bon article que vous avez du mettre un moment à écrire...
avatar janonimousse | 
Attend au moins lannonce officiel et de voir que ça fonctionne avant de faire le fan boy :)
avatar eldaran83 | 
@sopcaja : Genre MobileMe ?
avatar cdou59 | 
Joli sens de la répartie ;)
avatar winstonsmith | 
@misc : +1 Moi pour que j'utilise de la reconnaissance vocale faudra que ce soit convaincant...
avatar RaZieL54 | 
+1 Effectivement Apple a plutôt tendance a mettre en place des technologies fonctionnelles, plutôt que de se lancer dans des coup marketting avec des produits gadgets et approximatifs. Certes le contre exemple frappant c'est mobile.me, mais la l'explication c'est qu'il s'agissait d'une technologie en dehors du champ de competence d'Apple et l'equipe en charge de ce fiasco l'a payee cher. Le champ naturel et historique de compétences qui fait la réputation d'Apple et qui en fait un leader industriel incontesté c'est les interfaces homme-machine. Et depuis plus de trente ans Apple n'a pas de concurrents sur ce domaine, que des suiveurs. L'interaction vocale est une recherche de longue date chez Apple, qui date de plusieurs decenies comme le projet iPad. Les conférences developpeurs ont vu régulièrement des démonstrations et des évocations de technologies. Mais jusqu'a aujourd'hui c'est resté dans les labo car la puissance necessaire et les mises en oeuvres n'etaient pas pretes. Peut etre le sont elle aujourd'hui? En tout cas si Apple introduit une interface d'interaction vocale, ce sera effectivement la même révolution que l'arrivée du Macintosh en 83 et cela va bouleverser le monde informatique en profondeur.
avatar m_enfin | 
Carrément, bouleverser le monde informatique en profondeur, carrément, j'ai hâte de voir ça alors !
avatar The Verge | 
Mouais... 1 - Déjà que ça fonctionne bien en anglais... 2- +10 ans pour avoir le résultat en langue française...
avatar angealexiel | 
C'est comme FaceTime : ça fait super joli dans une pub et tout le monde dira "Whouah !!" pendant le keynote, mais en réalité, ça ne sert à personne parce que ce n'est pas naturel. Vous vous voyez franchement parler dans la rue à votre téléphone ? Si c'est ça le futur ça fait pas vraiment rêver ! A la rigueur des sites webs pornographiques avec qui tu peux faire la causette pourquoi pas, mais rechercher un resto...
avatar iCaramba | 
@YenoIwesa La visio est désactivable sur FT.....donc en famille visio et avec un autre utilisateur, boulot ou autre juste le son ;-)
avatar jarno24 | 
@YenoIwesa : 'Vous vous voyez franchement parler dans la rue à votre téléphone ? Si c'est ça le futur ça fait pas vraiment rêver !' Je préfère mille fois utiliser mon casque micro dans la rue pour lancer un titre ou un appel téléphonique que de sortir l'iPhone pour pianoter. Alors oui, lancer une recherche de la même façon m'intéresse et je ne sortirai l'appareil que pour consulter la carte. De toute façon, il m'apparaît évident que c'est l'avenir tout comme les gestures sont devenus une évidence d'aujourd'hui. Il faudra juste bien faire précéder la commande d'un geste ou d'une autre façon volontaire pour ne pas déclencher n'importe quoi dans le terminal.
avatar Marksanders | 
Y'a t il besoin de puissance ? Google fait ça en utilisant le réseau et ça marche très bien.
avatar m_enfin | 
Dans le cas d'Apple oui, dans le cas de Google c'est du full cloud les processeurs sont chez Google. Nous on fait une simple requête réseau et Google nous répond immédiatement... Peu importe le modèle. Sinon c'est intéressant, je demande à voir, je suis pas fan de la reconnaissance vocale, je m'amuse parfois avec (celle d'Android est très bien faut l'avouer), donc faut voir dans quelle mesure elle est utilisable. La technologie en elle même ouai c'est sympa of course, mais le plus intéressant sera sans doute l'usage qu'on pourra en faire, c'est la dessus qu'il faut convaincre, car sur les performances moi je suis déjà convaincu !
avatar m_enfin | 
Peut être, enfin c'est un peu ce que je dis... Ce qui est marrant avec toi Shenmue, c'est que c'est toujours une question d'enfoncer Android, comme si c'était l'objectif :) Ouf ! Moi je préfère voir Apple sortir ce genre de techno plutôt que de voir le duo ridicule qu'est Apple/Samsung en procès tu sais :d
avatar fif | 
Et pour un belge, imagine un peu (avec ou sans accent) : "j'ai dit 1 une fois, hein !"
avatar Lou117 | 
Je ne sais pas du tout quelles sont les capacités de ce soft et ce qu'Apple pourrait en faire, mais la reconnaissance de Google est très pratique et efficace. Je dicte souvent des bouts de mails ou des SMS avec sans soucis, sans parler des fonctions courantes (appel, directions...). La seule contrainte c'est la connexion car le téléphone n'est pas à même de décoder lui même. Si Apple arrive à faire ça, cela sera effectivement une révolution. Si il y a la contrainte du réseau, ça ne sera qu'un bon complément.
avatar winstonsmith | 
@monsterkill : Pourquoi tant de haine ? Ils doivent être deux à avoir parlé d'Android.
avatar m_enfin | 
Ben non, si ce que tu dis est vrai c'est cool si la reco vocale est excellente sur le prochain iPhone, il faut décompresser dans la vie. Pour ma part la reco vocale reste très secondaire, mais c'est un avis personnel... :d
avatar Lou117 | 
Pas du tout, j'évoque ça car c'est le seul système du genre que j'ai testé et utilisé. Si Siri est bien plus avancé et qu'il est bien intégré à iOS, cela sera une excellente chose. Aucune guéguerre là dedans, juste un avis pragmatique :)
avatar albert.dsf | 
En plus, let's talk iPhone…
avatar manu1707 | 
En tout cas ça expliquerait l'icône du répondeur dans l'invit. Je sens qu'il n'y aura pas d'iPhone 5 demain mais un iPhone 4S capable de faire tourner la reconnaissance vocale. A ma grande frustration. J'attends l'iPhone 5 pour changer de téléphone. Je ne suis pas fan du design du 4, avec son dos tout plat. Mais mon 3GS commence sérieusement à faire son âge... Le 5 était la solution idéale. Mais il semble qu'il faille attendre encore quelques mois pour ça... Évidemment si demain ils présentent aussi un 5 je serai ravi, mais je sens que la grande annonce ce sera plutôt ça.
avatar nasgule | 
@Ali Baba Vous avez tout à fait raison : il n'y aura pas d'Iphone 5 demain. C'est sûr : des personnes très bien informées, proche du dossier et occupant des places élevées dans l'organigramme me l'ont avoué à demi-mots (culte du secret oblige). Ceux qui l'attendent l'auront dans le baba, si je puis me permettre.
avatar angealexiel | 
@San_Pellegrino : Je suis le fils caché français de Steve Jobs, et je vous le dis, ne croyez pas ce que dit San Pellegrino, c'est un agent secret Russe qui travaille pour Samsung. Papa m'a dit que demain serait annoncé l'iPhone 16. Passer directement au 16 va permettre de dépasser le numéro de version de Google Chrome. Mais ne répétez à personne ce que je viens de vous dire, c'est classé top secret !!!
avatar Tiberius | 
Moi je ne suis pas encore prêt à parler à mon iPhone en public. Je déteste quand les répondeurs automatiques m'obligent à parler. On n'est pas toujours en mesure de parler : transports, foule, école, réunion, etc. Ca pose en outre des problèmes de vie privée. De plus, même s'ils arrivaient à faire un système de reconnaissance de parole plus performant que les systèmes actuels (qui sont suffisamment bons pour indexer des fichiers audio/vidéo mais pas assez pour écrire un bouquin), il reste encore le problème de l'interprétation.. Nos langages humains sont très ambigus. Souvent, le geste est nécessaire pour comprendre ce qu'on veut dire. Ca m'évoque d'ailleurs les travaux de Chris Schmandt (1979, MIT, http://www.youtube.com/watch?v=RyBEUyEtxQo), qui démontraient le "put that there" : combinaison du geste et de la parole pour commander un ordinateur.
avatar Pitiousss | 
Et dispo pour iPhone 4 ? Je sais bien que non il faut vendre le 4S mais je demande au cas ou… a demain pour la keynote en espérant que iOS 5 sera dispo dans la foulé.
avatar mat8834 | 
La vidéo de 1987 est tout simplement halucinante !! Jobs est plus qu'un visionnaire !! Je ne sais pas de quoi l'informatique sera fait demain, mais parfois, j'aimerais faire un voyage au centre du cerveau de Jobs pour connaître sa vision des choses... Jobs, c'est un peu le Doc dans Retour vers le Futur : sauf que sa Doloreane, c'est Apple... :-))
avatar manu1707 | 
@jujuv71 : En 1987, Jobs avait quitté Apple depuis deux ans déjà. (Plouf)
avatar mixo001 | 
si on a quelque chose qui fonctionne suffisamment bien pour écrire des sms/mails/documents pourquoi pas, ensuite si on peut parler de manière naturelle comme on parlerait lors d'un appel téléphonique ça serait pas mal, sinon ça ne m'intéresse pas
avatar Founs | 
Un téléphone dont l'utilisation est basée sur la voix ? Ils sont vraiment forts chez Apple…
avatar fif | 
C'est nouveau, c'est de la voix tactile, ou du toucher vocal (j'ai bien écrit VOcal, et je n'ai pas à RECtifier). :-)
avatar Mousse72 | 
Entendre les gens blablatter dans leur télêphone tout le temps et en tous lieux... Non, merci ! Non à la cacophonie ! Perso, j'aurais préféré qu'Apple planche sur Inkwell pour peaufiner une écriture qui au doigt comme au stylet se transforme en texte dactylographié.... Pour le coup je reste plus intrigué par le Samsung Note qui intègrera ce type de fonction plus la découpe de notes et d'illustration d'une appli vers une autre..... Ne pas oublier qu'Apple a continué à déposer des brevets pour le travail au stylet... Sur l'air de reculer sur le sujet pour mieux sauter demain... J'avais pu rêver avec l'idée d'interface Courrier de Microsoft.... Rien depuis ne m'a titillé de la sorte... Et dans le vocal, seule l'application Vocre, non disponible chez, nous mais qui joue le double traducteur pour s'entretenir avec un étranger est digne d'un futur intéressant... Alors le vocal à tout bout de champ va ressembler à une symphonie en boucle pour Gaffophone ! Quel cauchemar quand on pense à toutes les cervelles de moineau qui possèdent un iPhone... Cinéma, cinéma... Après "l'homme qui murmurait à l'oreille des chevaux"... "L'homme qui hurlait dans le micro de son iPhone"...
avatar Helmer | 
@jujuv71 : en 1987, Steve Jobs était hors d'Apple. Merci à John Sculley à qui on doit sûrement les PDA et nos smartphones actuel avec le Newton. Je sais ça fait mal à certains que cela ne soit pas de Saint Steve.

CONNEXION UTILISATEUR