3 moyens par lesquels Amazon veut rendre Alexa plus futée

Florian Innocente |

Amazon travaille à rendre plus fluide et plus naturelle la manière dont on utilise et s'adresse à son assistante Alexa. Son arrivée en France est actée, elle serait même disponible dans un mois (les pages d'aide technique sont déjà prêtes pour la plupart).

Ruhi Sarikay, qui dirige chez Amazon les travaux visant à perfectionner l'intelligence d'Alexa, dévoile trois nouveautés qui vont être prochainement déployées, avec comme objectifs de rendre moins rugueuse la relation entre l'assistant et ses utilisateurs.

Contrairement à Siri qui se repose sur un nombre limité de ressources extérieures, Alexa fait un grand usage des "skills", ces "compétences" proposées par des développeurs, des éditeurs ou même des marques (on peut les comparer aux apps sur iOS mais où l'interaction est essentiellement vocale).

Amazon Echo 2

Amazon compte quelques 40 000 skills aujourd'hui, rassemblées dans l'équivalent d'une boutique1. Il faut préalablement chercher puis installer celles dont on a besoin. On le fait soit depuis son smartphone et l'app Alexa soit au travers de son interface web. Ce qui peut se révéler fastidieux lorsqu'on a un besoin immédiat. L'assistant devrait pouvoir vous apporter une réponse en ayant préalablement cherché si une skill pouvait lui offrir cette compétence.

C'est ce que va faire Alexa, d'abord auprès des utilisateurs américains d'Echo. Ruhi Sarikay donne l'exemple d'une fois où il a demandé à son Echo comment nettoyer une tâche d'huile sur un tee-shirt. Alexa a compris le problème et a automatiquement cherché puis téléchargé la skill d'un fabricant de produits détachants, laquelle énonçait les différentes étapes à suivre pour nettoyer le vêtement. Pas besoin de chercher soi-même ou même de connaître le nom d'un produit, c'est à l'assistant d'aller farfouiller dans la bibliothèque des skills de tierces-parties.

Deuxième piste pour fluidifier les interactions : la capacité à comprendre des requêtes autour d'un même thème mais sans références explicites entre elles. Ce sera d'abord proposé aux utilisateurs américains, britanniques et allemands.

Précédemment, explique Ruhi Sarikay, on pouvait dire : « Alexa, quel était le premier album d'Adele ? » puis ajouter « Alexa, joue-le ». L'assistant détectait le lien entre les actions souhaitées grâce à la présence du pronom dans « joue-le ». Dorénavant la relation sera moins directe et l'assistant devra tout de même se débrouiller : « Alexa, quel temps fait-il à Seattle ? » suivi de « Et pour ce week-end ? ».

Alexa pourra gérer des contextes différents et savoir répondre à ce type d'enchaînement : « Alexa, quel temps fait-il à Portland » puis juste derrière : « Il faut combien de temps pour y aller ? ». Devant la même sollicitation, Siri va répondre pour la météo puis se contenter d'ouvrir Plans, mais sans aller plus loin.

Enfin, Sarikay parle d'une fonction de "mémoire" pour Alexa, elle sera testée par les américains d'abord. L'assistant pourra se souvenir de toutes sortes de choses qu'on lui indique. Toutefois, l'exemple fourni n'illustre pas vraiment ce potentiel de cette amélioration : « Alexa, rappelle-toi que l'anniversaire de Sean est le 20 juin ».

On est à la lisière d'une banale fonction de rappels (qui existe déjà avec Alexa sur les Echo). Ruhi Sarikay laisse entendre que ce n'est qu'un début, qu'à terme on pourra confier tout et n'importe quoi à Alexa et qu'Amazon fera en sorte « que ce soit facile pour les clients de sauvegarder ces informations, et qu'il y aura une manière naturelle de retrouver plus tard ces informations ».

Amazon a précisé depuis d'autres cas de figure qui font de cette fonction un véritable aide-mémoire pour tout un tas de sujets et pas seulement un outil de rappels

  1. Les skills ne sont pas épargnées par des problèmes de sécurité. Des chercheurs chez Checkmarx ont créé il y a quelques temps une skill qui écoutait en permanence ce que disait l'utilisateur, même après la fin de sa requête. À défaut du fichier audio (qui n'est pas transmis aux tiers) ils récupéraient une transcription de ce que l'enceinte avait entendu. Checkmarx avait exploité le fait qu'Alexa continue d'écouter quand elle ne comprend pas une commande. Mais pour que l'utilisateur ne s'aperçoive de rien, ils étaient parvenus à couper la chique à l'assistant pour qu'on n'entende pas qu'elle demandait à son propriétaire de répéter sa question. Ainsi le micro restait toujours ouvert. Il y a aussi un signal lumineux bleu, bien visible, qui témoigne de l'activation des micros mais les appareils de tierces parties qui intègrent Alexa n'en ont pas forcément ou peut-être de moins visibles. Amazon a modifié son système le 10 avril pour éviter de tels débordements. ↩︎

avatar Navareus | 

C’est intéressant, ce concept de skill ! Faut-il nécessairement que ce soit l’appareil qui compile ces fonctions en local, ou ça peut être un serveur applicatif distant ?
Siri reposant sur une connexion internet, on pourrait imaginer un serveur gonflé en skill qui fait gagner le temps de l’installation et se montre déjà exhaustif en skills dispo.
Encore faut-il qu’Apple s’en inspire ou découvre un moyen différent aux finalités proches.

avatar Sgt. Pepper | 

@Navareus

Il y a déjà les Apps iOS qui sont compatible « Siri et recherche »

Mais pas sûr que cela concerne les interactions vocales avec « Dis Siri » ?

avatar creatix | 

@Navareus

Les skills ne sont pas en local il me semble mais se le net avec des urls type webhook qui sont appelés, la réponse est retourne à la plate-forme Amazon qui renvoi au device.

avatar Navareus | 

@creatix

« Amazon compte quelques dizaines de milliers de skills aujourd'hui, rassemblées dans l'équivalent d'une boutique1. Il faut préalablement chercher puis installer celles dont on a besoin. On le fait soit depuis son smartphone et l'app Alexa soit au travers de son interface web. Ce qui peut se révéler fastidieux lorsqu'on a un besoin immédiat. L'assistant devrait pouvoir vous apporter une réponse en ayant préalablement cherché si une skill pouvait lui offrir cette compétence. »

D’après ce que je crois en comprendre, l’assistant compile en local les skills dont il a besoin pour apporter des réponses pertinentes. Ça sous-entend presque que l’appareil est doté d’une mémoire interne qui les stocke avant traitement. Si le nombre de skills commence à prendre de la place, on tend vers une gamme de produits proposés en différentes capacités de stockage.
Ou alors, comme tu dis, l’identifiant Amazon stocke dans le cloud les skills choisis quotidiennement par l’assistant domestique et accélère leur traitement en cas de réutilisation régulière.

avatar creatix | 

Effectivement l'article donne l'impression que l'application tourne en local mais ce n'est pas le cas, voici quelques source :
https://moduscreate.com/blog/build-an-alexa-skill-with-python-and-aws-lambda/
https://www.slideshare.net/RickWargo/build-an-alexa-skill-stepbystep

avatar Crkm | 

On se dirige vers un futur à la blackberry pour Apple, vu qu'ils ont loupé le tournant de l'IA. Tant pis pour eux.

avatar shaba | 

@Crkm

Sauf que BlackBerry n’a jamais eu les moyens illimités d’Apple... ils s’en sortiront à coup de rachat ou en faisant des concessions sur la vie privée comme les autres. Même si le temps presse il n’est pas trop tard du tout.

avatar flux_capacitor | 

@shaba
Il n’est pas trop tard mais même les géants aux ressources illimitées peuvent se gaufrer en prenant les mauvaises décisions sur le futur marché le plus porteur. Par exemple MS avec le mobile.

avatar shaba | 

@flux_capacitor

C’est un bon exemple mais je pense que les assistants n’ont pas la même importance que les smartphones eux-mêmes. Je peux me tromper bien sûr.

avatar flux_capacitor | 

Les assistants posés sur le meuble, non. Mais l'IA dématérialisée qu'il y a derrière, oui. L'IA c'est LE truc sur lequel tout va se jouer à court terme.

avatar TomTomC | 

Personnellement je trouve ces skills inquiétant. Vu que l’utilisateur ne saura pas où Alexa ira piocher ses informations, il suffit que des boîtes peu scrupuleuses propose des skills donnant des « vérités » qui seraient des pubs déguisées ou qu’un Russia Today propose de fausses infos pour qu’Alexa se transforme en monstre...

avatar flux_capacitor | 

@TomTomC
Ne vous inquiétez pas pour ça, la future loi anti fake news musèlera pour de bon toutes ces sources malfaisantes non alignées, et nous pourrons enfin jouir exclusivement et unilatéralement de l’Information Juste et Vraie servie par TF1 et BFMTV.

avatar TomTomC | 

@flux_capacitor

Le problème surtout c’est de savoir d’où vient l’information. Quand on lit Libé, Le Figaro ou Valeurs actuelles (ou même Russia Today) on sait ce que l’on lit et on peut avoir un esprit critique.
Si Alexa vous dit que dès 25 ans c’est meilleur pour la santé de se faire des tartines au beurre anti cholestérol sans prévenir que c’est Hubert Oméga 3 qui a développé le skill c’est plus gênant.

avatar Bigdidou | 

@TomTomC

Je pense que c'est un problème majeur et un accès au rêve de tous les manipulateurs, politiques, religieux, publicitaires, commerciaux et j'en passe : supprimer le sourçage de l'information et nous la faire avaler l'air de rien.
Ce truc est une abomination, tel qu'il est décrit ici.

avatar flux_capacitor | 

Oui, c'est le truc le plus important, le sourçage de l'info. Très peu de gens le font. Personnellement je lis plusieurs sources d'horizons opposés et je fais une "moyenne pondérée". Ça permet parfois de démasquer des énormités du côté des médias de masse. Du côté des sources alternatives, c'est plus difficile quand leur info est isolée, à prendre donc avec des pincettes.

Mais il faut penser par nous-même, sinon d'autres le feront pour nous.

CONNEXION UTILISATEUR