L'audio de la WWDC bidouillé pour éviter de réveiller Siri
Dans un podcast, John Siracusa, Casey Liss et Marco Arment mettent une chose intéressante en avant : Apple a visiblement modifié l'audio de sa conférence de la WWDC en postproduction pour éviter qu'une personne qui prononce « Siri » puisse activer Siri.
« Dis Siri », c'est fini
Dans l'Accidental Tech Podcast 539, vers 10 minutes, les intervenants discutent de cette modification. La raison pour laquelle Apple a modifié l'audio est évidente : une des nouveautés mises en avant est qu'il est possible de dire uniquement « Siri » et pas « Hey Siri » (ou « Dis Siri » en français) pour activer l'assistant.
Une partie des fréquences coupées
La façon de faire d'Apple est assez particulière et n'est pas la même que celle choisie par Amazon pour éviter d'activer des Echo durant une publicité en 2019. En effet un spectrogramme de l'audio de la WWDC montre très clairement que certaines fréquences sont coupées de façon abrupte quand le mot Siri est prononcé. Ce n'est pas systématique mais très visible quand le nom de l'assistant est prononcé seul.
Il y a des creux à 3 000 Hz, 4 000 Hz, 5 000 Hz et 6 000 Hz, qui doivent probablement empêcher les appareils compatibles avec la commande « Hey Siri » de réagir. Du point de vue de l'auditeur humain, la différence n'est pas (trop) audible, mais du point de vue d'un ordinateur, elle l'est probablement suffisamment pour éviter un déclenchement qui serait évidemment intempestif. Vous devriez entendre une différence dans cet extrait : les deux premières occurrences du mot « Siri » sont modifiées, mais pas la troisième.
c'est subtil, en effet.
Il n’empêche que j’ai désactivé « Dis Siri » sur tout mes appareils à cause de déclenchements intempestifs réguliers principalement devant la télévision.
D’ailleurs, lors de ces déclenchements intempestifs, je n’ai jamais identifié de mot ou l’expression prononcé à la télévision et qui pourrait ressembler de près ou de loin avec « Dis Siri »
@Fennec72
Des séries tv ?
Je viens de faire passer une soutenance où j’ai rencontré le problème avec le Siri de mon ordinateur.
D’ailleurs chez moi, c’est toujours et seulement l’ordinateur qui se déclenche intempestivement.
« pour éviter qu'une personne [...] active Siri »
Mieux il me semble :
« pour éviter qu'une personne [...] n'active Siri »
Cf. https://la-conjugaison.nouvelobs.com/fle/ne-expletif-95.php
@marc_os
Il y’a une fonction /mail pour les fautes dans l’article…
@RonDex
Que j’utilise souvent et ils sont tres réactifs !
J’aurais préféré ‘hey Siri’ que ‘dis Siri’. Plus naturel pour moi. Peut-être parce que je suis bilingue.
Et du coup, encore mieux avoir le choix de l’interjection depuis le début. Gros défaut de conception. Avéré dix ans plus tard.
Mais… comme un peu toute l’informatique le paradigme est tellement US Centric que s’en est devenu pathétique.
Je parle fluently les deux langues (et d’autres) mais ça m’irises le poil de constater le mépris des langues non anglo-saxonnes dès la conception.
Le poil irisé, ça ne doit pas manquer de charme! 🥰
Blague à part, la version française de "Hey Siri" aurait tout à fait pu être "Hé! Siri", l'interjection Hé servant à appeler ou interpeler quelqu'un
https://www.larousse.fr/dictionnaires/francais/hé/39270
@r e m y
Oui
@r e m y
Juste « hé ! » fait très vulgaire, pas très bon genre au bureau.
@r e m y
Assez chatoyant et haut en couleur 😜
Mais un poil sur l’iris, ça peut faire mal 😣
Hein ? Pourquoi on dirait Hey Siri en France pour éveiller Siri ? C’est au contraire si l’on était forcé à utiliser Hey Siri que ce serait trop « US centric »
Ne pas confondre "hey" (EN) et "hé" (FR).
@Tibimac
Je comprends. En tout cas pour la version anglaise, Apple a choisi Hey car c’était tellement naturel pour les utilisateurs à la sortie de Siri d’interpeller Siri comme ça (même si il n’existait pas encore) qu’ils ont compris que c’était le bon terme. Apple a du demander à son équipe française ce qui semblait le plus naturel, et la réponse a du être « dis »
@xDave
Sauf que le choix n'était pas trop possible au début avec les connaissances en IA et reconnaissance vocale. Il fallait qu'une puce de l'époque puisse reconnaître la voix en local sans envoyer le commentaire chez Apple contrairement à la requête elle-même qui l'était (elle l'est encore ?) pour interprétation par les serveurs de la pomme.
@koko256
Oui parce qu’ils ont consacré 32ko pour ça au lieu de 64 😂
Faux car depuis toujours Amazon propose de choisir l'onomatopée pour interpeller Alexa.
@Tibimac
On parle d'Apple. Amazon n'en a rien an foutre d'envoyer le flux audio continu sur ses serveurs.
@xDave
Je suis d’accord… c’est pas très naturel de prononcer "dit Siri".
Mon rêve serait de pouvoir choisir le mot clé que je désire. Lui donner un nom peu commun mais de mon choix. Peut-être un jour!
@xDave
Tout à fait ! Quel dommage de ne pas pouvoir personnaliser à la française !
Genre « eh connard de Siri », « eh enfoiré de Siri» …
Dans la légende de la 1ère image, c'est "horizontales" et non "verticales" je crois ?
Et si on prononce un autre mot mais en forçant artificiellement sur ces fréquences qui ici ont été supprimées, ou si on produit un son composé de ces seules fréquences... est-ce que ça n'activerait pas Siri sans même prononcer son nom par hasard? 🤔
@r e m y
Je pense que le but est juste de couper les fréquences pour qu'à la "cartographie" ça ne matche pas.
Moi ça a démarré Siri sur les HomePods quand je regardais le Keynote
@edbattistini123
Original ou seconde version les homepods ?
@koko256
HomePod mini première génération
Chaque utilisateur pourrait avoir la possibilité de personnaliser son invitation Siri avec sa propre voix.
@Sindanarie
Tout à fait d’accord avec vous quant à la possibilité de personnaliser la phrase d’activation : nous devrions avoir cette possibilité.
Apple préfère proposer une solution qui va être pire que tout. Avez-vous déjà parlé d’assistant vocal Apple ou Amazon… quand vous échangez avec d’autres personnes pour les définir ?
Généralement on parle d’Alexa, de Siri ; du genre « Siri n’a encore rien compris », « Siri ? Moi je l’utilise beaucoup, c’est très pratique même si l’assistant est loin d’être super efficace ».
A voir à l’usage, désormais nous risquons d’activer Siri simplement en parlant de lui sans pour autant souhaiter l’activer.
Les activations intempestives pouvaient déjà se produire avec « Dis Siri », je crains que ce ne soit bien pire avec « Siri » pour seule reconnaissance/identification vocale.
Chez Apple, ces dernières années, ça réfléchit sévère pour étoffer avec esbroufe les lignes de com dans les (key ou release) notes ! 😶🌫️😮💨
L’une des rares choses pour laquelle un retour en arrière fut une bénédiction : la restauration d’une connectique acceptable et du MagSafe sur les MacBook Pro (à partir du M1).
@Shepherd
"A voir à l’usage, désormais nous risquons d’activer Siri simplement en parlant de lui sans pour autant souhaiter l’activer."
Ou à évoquer la Syrie (rencontré assez fréquemment avec les infos), les séries, encore plus fréquent, ou bien quand Lassie rit…
Ok je 👉🚪
C’est sur que si il ne dit pas “dis Siri” il ne s’activera pas 😂