Google Assistant veut se passer du « Hey Google »

Mickaël Bazoge |

Supprimer les requêtes d'accroche pour activer les assistants (« Dis Siri », par exemple) n'est pas aussi évident qu'il y parait. Apple s'en est débarrassée sur l'Apple Watch depuis watchOS 5, mais il faut faire le geste de lever le poignet (et croiser les doigts pour que Siri pige quelque chose mais c'est une autre histoire).

Google lance aujourd'hui pour les clients américains du Nest Hub Max une nouvelle fonction Google Assistant pour ne plus avoir à dire « Hey Google ». Il faut regarder l'écran connecté et simplement lui poser une question.

Pour profiter de cette fonction, il est cependant nécessaire d'activer les options Face Match et Voice Match, car le Nest doit être en mesure d'identifier visuellement l'utilisateur, ainsi que sa voix. Mine de rien, cela nécessite six modèles d'apprentissage automatique qui traitent une centaine de signaux provenant de la caméra et du micro. Google précise que le traitement de la vidéo nécessaire à cette interaction est réalisé en local, sur l'appareil.

Toujours dans le même domaine, le Nest Hub Max va pouvoir reconnaitre certaines commandes routinières permettant de zapper le « Hey Google » honni. Comme par exemple « Allume les lumières du couloir » ou « Lance un minuteur de 10 minutes ». Ces « phrases rapides » doivent être activées au préalable.


avatar vomito | 

J’utilise Siri de plus en plus depuis que j’ai reçu un HomePod mini mais c’est vrai que c’est pénible de devoir dire la phrase magique à chaque fois

avatar Bigdidou | 

@vomito

« que c’est pénible de devoir dire la phrase magique à chaque fois »

? Tu lui demandes à chaque fois s’il s’est lavé la c…
Oups, ah oui, non, je confonds la phrase magique.

avatar helloagain | 

"et croiser les doigts pour que Siri pige quelque chose mais c'est une autre histoire" l'info la plus réaliste de tout Siri 🤣🤣🤣

avatar dujarrier | 

Je prefererais que chaque utilisateur puisse donner le nom qu’il souhaite a son assistant vocal, car d’autres noms plus court pourrait être utilisé ou bien serait plus fun (ex: « Kitt, ouvre la porte du garage » au lieu de « Hey Google, ouvre la porte du garage »,…)

Mais je suppose que cela pourrait aussi ouvrir la porte a certaines derives…

avatar IceWizard | 

@dujarrier

« Je prefererais que chaque utilisateur puisse donner le nom qu’il souhaite a son assistant vocal, car d’autres noms plus court pourrait être utilisé ou bien serait plus fun (ex: « Kitt, ouvre la porte du garage » au lieu de « Hey Google, ouvre la porte du garage »,…) »

Un ami, fan de star trek (et développeur Android) ne cesse de pester, car il voudrais commencer les ordres par « ordinateur .. » comme sur l’Enterprise.

Moi je voudrais lancer des commandes avec un seul mot, peu utilisé dans le langage courant. Par exemple « Lumos » pour allumer la lumière, comme dans Harry Potter. Juste un mot, sans avoir à spécifier un nom d’assistant avant.

Le latin et d’autres langues mortes regorgent de mots sympathiques à utiliser.

Évidemment ce système nécessite une analyse vocale locale, pour ne pas envoyer toutes les conversations à un ordinateur situé sur un autre continent.

avatar Lu Canneberges | 

@IceWizard

> « Moi je voudrais lancer des commandes avec un seul mot, peu utilisé dans le langage courant. Par exemple « Lumos » pour allumer la lumière, comme dans Harry Potter. Juste un mot, sans avoir à spécifier un nom d’assistant avant. »

Ça commence avec Raccourcis sur iOS et c’est aussi possible avec le HomePod… mais il faut une interaction physique :
• je déclenche Siri sur mon iPhone et dit « Lumos », ça active la lampe torche du téléphone, pratique quand on n’a pas l’écran sous les yeux
• j’appuie sur le HomePod et dit « Cinéma » et il met toutes les lampes en rouge sombre ou éteintes, allume la multiprise de la télé, la télé, l’Apple TV et un bandeau lumineux sous la télé et arrête la musique/radio… c’est assez magique !

Mais pour se passer de « Dis Siri » il faut appuyer sur un bouton, il n’y a pas de miracle…

Et surtout, le « Dis Siri » permet que nos appareils n’analysent ce qu’on dit « que » si on leur demande, et donc n’envoient pas sur un serveur tout ce qui est trop compliqué, alors que se passer de la commande d’activation voudrait dire qu’ils essayent de comprendre absolument tout ce qu’on dit, et là je vois un autre gros problème :

quid de toutes les fois où on pose une question à une autre personne dans la pièce ? On n’a pas forcément besoin que Siri nous lise Wikipedia à tout bout de champ, et ce serait un peu flippant si iel nous déclamait notre calendrier chaque fois qu’on demande « alors on fait quoi ce week-end » ?

Pouvoir distinguer clairement si l’on parle à un humain ou à une machine me semble indispensable pour le moment.

D’où l’activation par mot-clé ou activation (j’aime bien l’action avec l’Apple Watch, les AirPods, la télécommande Apple TV ou la tape sur le HomePod, et puis le bon vieux bouton d’accueil/verrouillage !).

Après effectivement le compromis pour commencer pourrait être l’activation automatique uniquement sur quelques phrases clés (comme ici Google avec seulement 2 exemples) clairement définies et choisies et alors Lumos pourrait être sympa oui ! Mais attention on risque de repartir dans l’envoi sur des serveurs de tout ce qu’on dit, à moins d’avoir un processeur local assez puissant et un contrat clair avec l’entreprise.

Bref, un champ passionant d’études et réflexions pour les 5 prochaines années !

avatar BleuRooster | 

Pourquoi ne pas juste dire Siri ou Google comme Alexa ou Jarvis 🙄

Quand j’appelle les enfants je dit pas « Ok/hey louis met la table » ou « dit louis met la table » 😅

Ou nous laissé choisir le prénom de notre assistant dans le calendrier…. 😁

avatar iPop | 

@BleuRooster

C’est pas faut, cela éviterait que tous les iPhone ou assistants des amis réagissent en même temps.

avatar BleuRooster | 

@iPop

Reconnaissance vocale….

avatar David Finder | 

@iPop

Avec la reconnaissance vocale des utilisateurs maintenant activée sur Siri, ce genre de chose n’arrive plus.
Au pire, Siri te demande qui lui parle.

avatar Bigdidou | 

@David Finder

« Avec la reconnaissance vocale des utilisateurs maintenant activée sur Siri, ce genre de chose n’arrive plus. »

C’est pour ça que Siri se déclenche beaucoup moins (presque plus) de façon intempestive depuis quelques temps ?
Il y a eu un moment où c’en était devenu problématique pour moi…
Content que ce se soit arrangé, en tout cas.

avatar David Finder | 

@BleuRooster

Ça me parait bien compliqué, dans la mesure où tu peux parler de Siri ou des autres assistants vocaux dans une conversation, et avec des potes geek ça arrive souvent, et tu n’aurais pas envie que ton assistant s’active à chaque fois.

Par contre, le « dis Siri » est vraiment naze et pas du tout naturel je trouve. J’ai toujours envié le « Hey » de Google.

avatar BleuRooster | 

@David Finder

Bah j’ai un Eco Dot(4) donc Alexa, il y a aucun soucis, si Apple ou Google n’est pas capable de faire comme Amazon…..

avatar bozzo | 

C’est la seule raison pour laquelle j’ai choisi les EchoDot.
Alexa c’est naturel.
Hey Google et encore pire Dis Siri, c’est vraiment pas naturel.

CONNEXION UTILISATEUR