L'audio de la WWDC bidouillé pour éviter de réveiller Siri

Pierre Dandumont |

Dans un podcast, John Siracusa, Casey Liss et Marco Arment mettent une chose intéressante en avant : Apple a visiblement modifié l'audio de sa conférence de la WWDC en postproduction pour éviter qu'une personne qui prononce « Siri » puisse activer Siri.

« Dis Siri », c

« Dis Siri », c'est fini

Dans l'Accidental Tech Podcast 539, vers 10 minutes, les intervenants discutent de cette modification. La raison pour laquelle Apple a modifié l'audio est évidente : une des nouveautés mises en avant est qu'il est possible de dire uniquement « Siri » et pas « Hey Siri » (ou « Dis Siri » en français) pour activer l'assistant.

Une partie des fréquences coupées

La façon de faire d'Apple est assez particulière et n'est pas la même que celle choisie par Amazon pour éviter d'activer des Echo durant une publicité en 2019. En effet un spectrogramme de l'audio de la WWDC montre très clairement que certaines fréquences sont coupées de façon abrupte quand le mot Siri est prononcé. Ce n'est pas systématique mais très visible quand le nom de l'assistant est prononcé seul.

Les quatre bandes horizontales sont totalement artificielles.
Les quatre fréquences coupées sont bien visibles.

Il y a des creux à 3 000 Hz, 4 000 Hz, 5 000 Hz et 6 000 Hz, qui doivent probablement empêcher les appareils compatibles avec la commande « Hey Siri » de réagir. Du point de vue de l'auditeur humain, la différence n'est pas (trop) audible, mais du point de vue d'un ordinateur, elle l'est probablement suffisamment pour éviter un déclenchement qui serait évidemment intempestif. Vous devriez entendre une différence dans cet extrait : les deux premières occurrences du mot « Siri » sont modifiées, mais pas la troisième.

Tags
#Siri
avatar ofaysse | 

c'est subtil, en effet.

avatar Fennec72 | 

Il n’empêche que j’ai désactivé « Dis Siri » sur tout mes appareils à cause de déclenchements intempestifs réguliers principalement devant la télévision.

D’ailleurs, lors de ces déclenchements intempestifs, je n’ai jamais identifié de mot ou l’expression prononcé à la télévision et qui pourrait ressembler de près ou de loin avec « Dis Siri »

avatar pat3 | 

@Fennec72

Des séries tv ?
Je viens de faire passer une soutenance où j’ai rencontré le problème avec le Siri de mon ordinateur.
D’ailleurs chez moi, c’est toujours et seulement l’ordinateur qui se déclenche intempestivement.

avatar marc_os | 

« pour éviter qu'une personne [...] active Siri »

Mieux il me semble :
« pour éviter qu'une personne [...] n'active Siri »

Cf. https://la-conjugaison.nouvelobs.com/fle/ne-expletif-95.php

avatar RonDex | 

@marc_os

Il y’a une fonction /mail pour les fautes dans l’article…

avatar Sanid35 | 

@RonDex

Que j’utilise souvent et ils sont tres réactifs !

avatar xDave | 

J’aurais préféré ‘hey Siri’ que ‘dis Siri’. Plus naturel pour moi. Peut-être parce que je suis bilingue.

Et du coup, encore mieux avoir le choix de l’interjection depuis le début. Gros défaut de conception. Avéré dix ans plus tard.

Mais… comme un peu toute l’informatique le paradigme est tellement US Centric que s’en est devenu pathétique.

Je parle fluently les deux langues (et d’autres) mais ça m’irises le poil de constater le mépris des langues non anglo-saxonnes dès la conception.

avatar r e m y | 

Le poil irisé, ça ne doit pas manquer de charme! 🥰
Blague à part, la version française de "Hey Siri" aurait tout à fait pu être "Hé! Siri", l'interjection Hé servant à appeler ou interpeler quelqu'un
https://www.larousse.fr/dictionnaires/francais/hé/39270

avatar xDave | 

@r e m y

Oui

avatar iPop | 

@r e m y

Juste « hé ! » fait très vulgaire, pas très bon genre au bureau.

avatar DG33 | 

@r e m y

Assez chatoyant et haut en couleur 😜
Mais un poil sur l’iris, ça peut faire mal 😣

avatar Kwikyyy | 

Hein ? Pourquoi on dirait Hey Siri en France pour éveiller Siri ? C’est au contraire si l’on était forcé à utiliser Hey Siri que ce serait trop « US centric »

avatar Tibimac | 

Ne pas confondre "hey" (EN) et "hé" (FR).

avatar Kwikyyy | 

@Tibimac

Je comprends. En tout cas pour la version anglaise, Apple a choisi Hey car c’était tellement naturel pour les utilisateurs à la sortie de Siri d’interpeller Siri comme ça (même si il n’existait pas encore) qu’ils ont compris que c’était le bon terme. Apple a du demander à son équipe française ce qui semblait le plus naturel, et la réponse a du être « dis »

avatar koko256 | 

@xDave

Sauf que le choix n'était pas trop possible au début avec les connaissances en IA et reconnaissance vocale. Il fallait qu'une puce de l'époque puisse reconnaître la voix en local sans envoyer le commentaire chez Apple contrairement à la requête elle-même qui l'était (elle l'est encore ?) pour interprétation par les serveurs de la pomme.

avatar xDave | 

@koko256

Oui parce qu’ils ont consacré 32ko pour ça au lieu de 64 😂

avatar Tibimac | 

Faux car depuis toujours Amazon propose de choisir l'onomatopée pour interpeller Alexa.

avatar koko256 | 

@Tibimac

On parle d'Apple. Amazon n'en a rien an foutre d'envoyer le flux audio continu sur ses serveurs.

avatar Terragon | 

@xDave

Je suis d’accord… c’est pas très naturel de prononcer "dit Siri".

Mon rêve serait de pouvoir choisir le mot clé que je désire. Lui donner un nom peu commun mais de mon choix. Peut-être un jour!

avatar Adodane | 

@xDave

Tout à fait ! Quel dommage de ne pas pouvoir personnaliser à la française !
Genre « eh connard de Siri », « eh enfoiré de Siri» …

avatar nicolasnwf | 

Dans la légende de la 1ère image, c'est "horizontales" et non "verticales" je crois ?

avatar r e m y | 

Et si on prononce un autre mot mais en forçant artificiellement sur ces fréquences qui ici ont été supprimées, ou si on produit un son composé de ces seules fréquences... est-ce que ça n'activerait pas Siri sans même prononcer son nom par hasard? 🤔

avatar Bobu77 | 

@r e m y

Je pense que le but est juste de couper les fréquences pour qu'à la "cartographie" ça ne matche pas.

avatar edbattistini123 | 

Moi ça a démarré Siri sur les HomePods quand je regardais le Keynote

avatar koko256 | 

@edbattistini123

Original ou seconde version les homepods ?

avatar edbattistini123 | 

@koko256

HomePod mini première génération

avatar Sindanarie | 

Chaque utilisateur pourrait avoir la possibilité de personnaliser son invitation Siri avec sa propre voix.

avatar Shepherd | 

@Sindanarie

Tout à fait d’accord avec vous quant à la possibilité de personnaliser la phrase d’activation : nous devrions avoir cette possibilité.
Apple préfère proposer une solution qui va être pire que tout. Avez-vous déjà parlé d’assistant vocal Apple ou Amazon… quand vous échangez avec d’autres personnes pour les définir ?
Généralement on parle d’Alexa, de Siri ; du genre « Siri n’a encore rien compris », « Siri ? Moi je l’utilise beaucoup, c’est très pratique même si l’assistant est loin d’être super efficace ».
A voir à l’usage, désormais nous risquons d’activer Siri simplement en parlant de lui sans pour autant souhaiter l’activer.
Les activations intempestives pouvaient déjà se produire avec « Dis Siri », je crains que ce ne soit bien pire avec « Siri » pour seule reconnaissance/identification vocale.
Chez Apple, ces dernières années, ça réfléchit sévère pour étoffer avec esbroufe les lignes de com dans les (key ou release) notes ! 😶‍🌫️😮‍💨
L’une des rares choses pour laquelle un retour en arrière fut une bénédiction : la restauration d’une connectique acceptable et du MagSafe sur les MacBook Pro (à partir du M1).

avatar pat3 | 

@Shepherd

"A voir à l’usage, désormais nous risquons d’activer Siri simplement en parlant de lui sans pour autant souhaiter l’activer."

Ou à évoquer la Syrie (rencontré assez fréquemment avec les infos), les séries, encore plus fréquent, ou bien quand Lassie rit…

Ok je 👉🚪

avatar ⚜Dan | 

C’est sur que si il ne dit pas “dis Siri” il ne s’activera pas 😂

CONNEXION UTILISATEUR