Assistant iOS 5 : « un événement qui change tout »

Anthony Nelzin-Santos |

9to5 Mac a eu l'occasion d'interroger Norman Winarsky, vice-président de SRI Ventures et investisseur dans Siri, cette société ayant conçu un assistant vocal achetée par Apple en mai 2010. La rumeur veut que cette technologie soit intégrée dans iOS 5 sous la forme d'un « Assistant », un système très avancé de commandes vocales. Pour Winarsky aucun doute : cette intégration sera « un événement qui change tout ».

Apple fait partie de la poignée de sociétés qui ont défini les contours de la micro-informatique. Elle a par exemple participé à l'émergence de l'ordinateur personnel en achetant les travaux du PARC de Xerox et en s'en servant comme base pour l'interface du Lisa (lire : Le Lisa souffle ses bougies), en inventant des métaphores aujourd'hui communes (la barre de menu, les menus déroulants, le copier-coller ou la corbeille), et en prenant une licence sur les travaux de Douglas Engelbart et en transformant sa souris en un objet fiable et productible en grande série (lire : Une vieille histoire de rongeur). Plus récemment, elle a permis aux technologies tactiles multi-point de sortir des labos et a mis au point un dictionnaire de gestuelles devenu la lingua franca du domaine.

Apple s'est par contre tenu à l'écart d'un champ pourtant dynamique, celui de l'interaction vocale, tout comme elle a sciemment ignoré le champ de l'interaction au stylet. La voix est pourtant, avec la manipulation tactile, une des pierres angulaires des interfaces utilisateur « naturelles ». C'est une passion de Bill Gates, et un axe de recherche important pour Microsoft, qui s'est notamment porté acquéreur de TellMe, une société dont les technologies sont à la base du système de reconnaissance vocale de Windows Phone 7. Dans Android, Google dispose de son propre système de reconnaissance vocale, qui utilise les serveurs de la firme de Mountain View pour déchiffrer la question posée et calculer une réponse pertinente.

L'acquisition de Siri par Apple a naturellement posé des questions : c'était le premier pas de la firme de Cupertino dans la direction du développement d'une interface vocale. Siri a été fondée en 2007 au sein de SRI à partir des connaissances acquises lors du développement du programme CALO du DARPA, l'agence du ministère américain de la Défense qui a permis le développement du radar, d'ARPANET (l'ancêtre d'Internet), de l'hypertexte ou du GPS. Le but de CALO était de créer une intelligence artificielle qui soit un assistant personnel capable d'apprendre et qui puisse être commandé à la voix. Des technologies dont l'application commerciale était évidente : après trois ans de travail et deux mois seulement après la sortie de son application iOS, Siri est achetée par Apple, pour une somme estimée à 200 millions de dollars.

Fait rare pour être remarqué : les trois co-fondateurs de Siri sont encore aujourd'hui chez Apple.

Winarsky s'exprime comme quelqu'un connaissant bien le potentiel des technologies de Siri, même s'il est resté chez SRI. Il ne fait presque aucun doute qu'Apple a pris une licence sur les technologies de Nuance, un des meilleurs spécialistes de la reconnaissance vocale. Son moteur servirait aujourd'hui de base aux technologies de Siri. Siri est un assistant personnel, un moteur de recherche intelligent à qui l'on pose une question en langage courant, question que reformule et interprète Siri, qui vous donne ensuite la réponse sous la forme de résultats. Si on lui dit « je cherche un restaurant italien romantique à côté du boulot », le système vous donnera une liste des restaurants italiens dont les critiques mentionnent que leur ambiance est romantique et qui sont situés à proximité de votre lieu de travail. Vous pouvez ensuite lui demander de faire une réservation à un des restaurants de la liste. Mieux encore : si vous cherchez alors une séance pour la comédie romantique de la semaine, Siri vous donnera alors les séances dans les salles de cinéma à proximité du restaurant italien sélectionné plus tôt.

Comme le fait remarquer Winarsky, ce système est gourmand en ressources : la reconnaissance vocale nécessite un processeur de signal numérique spécifique, et le calcul des résultats nécessite une grande puissance pour analyser les données. Un iPhone de nouvelle génération ne serait donc pas de trop. Winarsky insiste sur le fait qu'il n'a aucune connaissance des intentions d'Apple, mais que les indices laissés dans les versions de développement d'iOS 5 tendent à montrer que la présentation d'un Assistant basé sur les technologies de Siri est imminente.

L'implémentation de ces technologies est sans aucun doute, selon lui, de portée à « tout changer » : « Siri était à des années-lumière devant [les technologies de Google et Nuance], ou au moins l'était-il il y a deux ans. […] Si ces rumeurs sont vraies, Apple va permettre à des millions et des millions de personnes d'interagir avec les machines à l'aide du langage naturel. […] On parle d'une nouvelle révolution technologique. Un nouveau changement de paradigme informatique. Cela me rappelle un autre projet du SRI, celui de Doug Engelbart, l'inventeur de la souris dans les années 60. De la même manière que Steve Jobs s'est emparé de cette technologie, nous pensons qu'Apple va utiliser Siri pour initier une nouvelle révolution ». Une nouvelle « révolution » qui rappelle le Knowledge Navigator, un assistant personnel informatique imaginé par Apple… en 1987 (lire : Une petite histoire de l'iPad).

Accédez aux commentaires de l'article