Chez Google aussi de petites oreilles écoutent les enregistrements audio de l'Assistant

Florian Innocente |

Après la diffusion d'un documentaire sur le traitement des données obtenues par ses assistants, Google a voulu relativiser la place accordée à des personnes dans l'écoute et l'analyse de ces contenus. Une communication qui laisse des questions sans réponse.

Dans un billet, Google affirme que les experts qu'il fait travailler aux quatre coins du monde, pour écouter et retranscrire des extraits audio, ne travaillent que sur 0,2% environ de cette masse de données. C'est déjà une indication mais l'Assistant de Google traite probablement des millions de requêtes par jour : les petits pourcentages peuvent faire de grandes rivières.

Présentation à la presse du Google Nest Hub

Google ajoute que des précautions sont prévues pour dissocier ces enregistrements des comptes utilisateurs, de manière à les anonymiser. Ces employés ont pour instruction de ne coucher par écrit que les instructions données explicitement à l'assistant, pas les propos qu'ils pourraient entendre en arrière-plan.

Google affirme aussi avoir ouvert une enquête au vu de la rupture du contrat de confidentialité dont a été coupable cet employé, interviewé masqué pour une émission diffusée en Belgique.

Cette communication esquive toutefois des questions soulevées par ce documentaire signé VRT NWS. On y voit que Google emploie des prestataires à travers le monde pour écouter des extraits audio qui leur sont envoyés en grands volumes tous les mois. Le témoin de l'émission dit en traiter environ 1 000 par semaine.

Ces opérateurs ont pour mission de les retranscrire, afin d'améliorer les capacités d'analyse de l'assistant. Déjà, Google ne prévient nulle part dans ses conditions d'utilisation qu'elle sous-traite ces informations, ou tout simplement qu'elle les confie à des personnes pour écoute.

Autre problème, ces enregistrements ont beau être séparés de l'identité de ceux qui les ont provoqués, il arrive fréquemment que l'assistant capte par erreur des propos qui ne lui étaient pas destinés.

Tous ceux qui utilisent les assistants d'Apple, de Google ou d'Amazon ont été confrontés à ces réveils impromptus de ces logiciels, alors qu'on ne les avaient pas appelés. L'assistant comprend mal et croit avoir entendu un "Dis Siri" ou un "Alexa", alors que non. Pour ajouter à ces problèmes déjà courants, la personne interrogée explique que l'assistant de Google a des progrès à faire en flamand et que les erreurs d'interprétation pour détecter correctement un "Ok Google" peuvent aussi s'expliquer par ce biais.

L'interface utilisateur pour écouter ses propres enregistrements et les effacer

Le journaliste raconte ensuite que sur un peu plus de 1000 enregistrements passés en revue, il en a compté 153 qui avait été captés par erreur par l'assistant et livrés pour retranscription. De là découle un autre problème, ces enregistrements impromptus peuvent contenir des informations plus personnelles puisque la personne ne s'adressait pas à son enceinte.

Le journaliste est allé à la rencontre d'un couple et d'un homme dont les adresses ou noms étaient présents dans ces extraits audio. Chacun a pu confirmer qu'il s'agissait bien de sa voix ou de celle d'une personne dans la maison. D'une manière plus générale, même si l'assistant a correctement réagi à une demande, il peut fréquemment récupérer des infos telles que des demandes de rendez-vous chez un médecin, des noms ou adresses, qui tomberont peut-être dans les oreilles de ces employés.

L'opérateur raconte avoir écouté un jour un fichier audio dans lequel une femme semblait en détresse, peut-être violentée. Que faire lorsque cela se produit, comment réagir ? Les consignes de Google n'abordent pas ce genre de situation, constate-t-il désabusé. Et de réaliser à ce moment-là que ce ne sont plus seulement des voix qui sont écoutées à la chaîne, mais des personnes dans leur quotidien.

Le logiciel d'écoute et de retranscription utilisé par les prestataires de Google

La critique faite à Google porte avant tout sur l'absence de transparence sur les coulisses de l'analyse de ces données. Sur l'implication de personnes en chair et en os, pas toujours employées par Google, qui écoutent ces échanges. Alors que peut-être beaucoup de ces propriétaires d'enceintes intelligentes croient que leurs voix ne sont traitées que par des ordinateurs et logiciels.

Ce sujet fait écho à des questions similaires à propos d'Amazon qui s'appuie lui-aussi sur l'oreille d'êtres humains pour améliorer Alexa, avec des problématiques identiques.

avatar rikki finefleur | 

Webhall

Ce qui est intéressant , c'est qu'a la fois des firmes privées et des gouvernements font désormais grace aux smartphone, internet et cie , un flicage permanent de nos vies, de nos messages et relations, choses qui auraient paru totalement insensées il y a 20 ANS, et qui auraient rameuté toute la population dans la rue..

Conclusion,
Nous ne sommes devenus que des moutons, et manifestement nous n'avons plus qu'a braire et a se soumettre , plus ou moins rapidement par ailleurs.
Mais que ceux qui utilisent facebook et cie, ou ceux qui achetent des micros espions chez eux, ne viennent pas de plaindre en premier lieu.

avatar fifounet | 

@webHAL1

« Merci pour l'intégralité de ton commentaire »

Effectivement on peut le remercier pour son avis et expérience.
Après que dire de ton rajout en le citant ?
Était il nécessaire de rajouter une couche haineuse à son propos ?
Lui s’en est parfaitement passé en évitant les jugements de valeurs stupides.
Toi apparement c’est toujours plus fort que toi
Rien a changé ...

« qui rassure sur le fait que certains ici sont encore capable de faire preuve d'intelligence, parmi les nombreuses personnes qui ne comprennent rien et se content de beugler »

Je constate en ce qui te concerne qu’il n’y a rien de nouveau sous le soleil.
Toujours cette façon de dénigrer et d’insulter indirectement un bonne partie des participants sans pour autant en cibler un en particulier et ne pas de faire accuser. On ne peut donc rien te reprocher.
Alors qu’en ce qui te concerne dès qu’on t’attaque ça disqualifie directement ton interlocuteur.
Mais peut être comptes tu sur la dilution de la mémoire collective de ce forum pour passer à travers ta façon de faire « faites ce que je dis pas ce que je fais »🤔

« Comment peut-on être à ce point fermé aux nouvelles technologies ? »

Ne pas être ouvert aux nouvelles technologies n’est pas une tare , même si ce n’est pas mon cas .
On peut vivre sans, suffit juste de faire preuve de tolérances.
Ce qui te manque apparemment.

avatar Bruno de Malaisie | 

La question de l’enregistrement de la femme violentée fait froid dans le dos.
“Minority Report”
Ou un autre adage.
L’enfer est pâvé de bonnes intentions.

avatar Yves SG | 

Utiliser les services de “don’t be evil” après avoir lu ses conditions générales est d’une inconséquence grave.
La répartition des richesses, l’égalité et même l’écologie sont secondaires par rapport au danger que représente cet incommensurable amas de données, pas que personnelles.

avatar rikki finefleur | 

Il parait que des gens achètent en toute connaissance de cause des micros espions à leur domicile.
Peut être faudrait il commencer par là ..

avatar bibi81 | 

Il paraît qu'il y a des gens qui refusent d'acheter ses appareils parce qu'ils ne veulent pas être écoutés chez eux mais ils portent sur eux un smartphone qui fait exactement la même chose.

avatar Achylle_ | 

Quand on voit le nombre d’appareils sous androïd et d’assistants capables de comprendre Ok Google, la quantité de données qu’ils emmagasinent est vertigineuse.

Seul l’avenir nous dira si ce qu’il en ressort est plutôt bon ou mauvais pour la majorité.
En attendant je préfère l’approche d’Apple, quite à avoir un Siri moins performant.

avatar Phiphi | 

En tout cas Google a été très clair, ils vont tout faire pour punir le salarié qui a parlé au journaliste !
Si c’est pas la preuve du très grand respect qu’ils portent à leur utilisateurs, ça !!!
Parce que bon, ce que le bipède ignore ne peut pas l’inquiéter, c’est mieux pour son moral. 🤷‍♂️

avatar stemou75 | 

Perso je n’utilise pas ces assistants de « soit-disant Intelligence » Artificielle. Je les trouve trop lents et pas assez fiables.

Après, je ne vois pas ce qu’il y a de surprenant à ce que les fournisseurs travaillent à améliorer la performance des assistants.

Vous savez que vos iPhone envoient aussi par défaut des infos anonymisées à Apple sur leur utilisation pour amélioration. Idem sur Mac. C’est pas spécifique aux assistants. Perso j’ai désactivé ces envois.

Il faudrait que la possibilité d’écoutes humaines puisse être désactivable aussi sur ces assistants.
Ces reportages font progresser la transparence. C’est positif. Les questions d’éthique sont complexes sur les nouvelles technologies.

Et puis faites comme moi : installez Qwant sur votre iPhone. Tout le monde critique Google mais personne ne se bouge un peu quand de bonnes alternatives sont proposées.

avatar alan1bangkok | 

@stemou75

le seul fait de posséder un smartphone ou une carte bancaire et de l’utiliser suffit à etre tracé et espionné avec ou sans Goggle Amazon et 
bref débat sans fin pour prise de tête moderne

avatar guiom2510 | 
avatar iPop | 

Le pire c’est que tu as toujours un commentaire pour dire qu’il n’a ri3n à cacher. 🧐

avatar mateodu13 | 

Tous les assistants écoutent en permanence !
Même celui d’Apple

avatar Yves SG | 

@mateodu13

Certes, mais tous les business model ne sont pas de vendre des données...

avatar alan1bangkok | 

@Yves SG

et ?

avatar marenostrum | 

c'est normal et Apple fait pareil (même pour les photos). sinon ils auraient pas besoin de 400 milles employées. l'intelligence artificielle c'est un mensonge.

avatar Chris K | 

@marenostrum : En quoi l’intelligence artificielle est un mensonge ?

avatar marenostrum | 

ça veut dire que la machine n'apprend pas tout seul. elle a besoin de toujours avoir des gens derrière, pour lui fournir l'intelligence, de faire la différence, de bien choisir, etc.

par ex, quand la machine entend le mot Police dans une pièce quelque part, elle ne sait pas l'interpréter. juste elle envoie une alerte au gars derrière pour que lui traite le cas. c'est un cas grave où il faut appeler la police, ou ce mot est utilisé sans gravité. etc.

la machine ne fera jamais tout seul la différence. elle va appeler dans tous les cas la police, ou rien du tout.
aussi tous les questions dont la machine ne comprend pas, sont traitées par les gens derrière. pour lui préparer la réponse juste dans le futur, quand la même question sera posée encore à la machine par quelqu'un d'autre. etc.

avatar Chris K | 

@marenostrum : Ce n’est pas un mensonge vu que ça a toujours été ainsi. Le principe est de fournir une base d’exemples avec les résultats attendus (des résultats vrais et faux, c’est la phase dite d’apprentissage « supervisée »), puis la machine est capable de généraliser, catégoriser et de fournir des résultats à partir de données qu’elle n’a jamais vu auparavant. Toute la complexité revient à choisir les bons exemples pour l’apprentissage et à choisir la bonne structure de traitement des données (typiquement la topologie d’un réseau de neurones si on utilise ce genre de machine). Des fois la machine se gourre, faut donc lui fournir d’autres données à apprendre.
C’est efficace pour certaines tâches (reconnaissance vocale etc.) face à des algorithmes plus classiques.
Parfois quand ça coince on ne sait pas vraiment pourquoi : dans le cadre d’un réseau de neurones, c’est un peu une boite noire.

Les techniques utilisées n’ont guère évoluées depuis 20, 30 ans (à part l’apport de l’apprentissage profond). On a simplement mis plus de ressources humaines et on bénéficie de plus de puissance de calcul avec même des puces dédiées.

avatar marenostrum | 

ça ne s'appelle pas l'intelligence artificielle alors. même si le mot intelligence a perdu le sens, comme tous les mots emprunté du latin et que personne ne connait plus la définition première.
intelligence c'est apprendre TOUT SEUL, normalement. pour ça qu'on dit pour quelqu'un qu'il est intelligent. il est né comme ça. on peut pas devenir intelligent par apprentissage extérieur, etc.
sinon l'intelligence serait en héritage. un gars intelligent il pouvait faire son fils encore plus intelligent que lui et ainsi de suite. mais c'est pas le cas.

avatar Chris K | 

@marenostrum : Désolé mais on appelle cela l’intelligence artificielle. Cela fait référence à aux processus mentaux (d’où le terme intelligence) mis en œuvre, simulés par des programmes (d’où le terme artificiel). C’est le terme usité, compris par tous et parfaitement valable.

C’est un peu comme si tu disais que le terme « trou noir » c’est un mensonge car en vérité c’est pas un trou mais une sphère.

Quant au fait d’apprendre tout seul... Mouais... Un réseau de neurones apprend tout seul pour ainsi dire, il s’auto ajuste en fonction des données qu’on lui donne. Un peu comme toi quand tu as appris à lire (t’a pas appris tout seul spontanément paf).

avatar romainB84 | 

@Chris K

La notion « d’intelligence artificielle » est surtout le terme vulgarisé par le grand public des méthodes de réseaux neuronaux d’apprentissage profond!
Quand on parle de « deep learning » c’est justement pour évoquer le fait qu’il s’agit justement d’un apprentissage (ou dit autrement: « je suis stupide au départ, mais je m’améliore avec de nouveaux input »)
Après pour le débat philosophique sur « est ce qu’il s’agit d’intelligence ou non » là je vais poser mon joker et vous laisser débattre entre vous 😉

avatar Chris K | 

@romainB84 : Le terme n’est pas vulgarisé par le grand public... il a été inventé par des scientifiques... Dans cette discipline le débat philosophique est intéressant mais peu adapté ici... pas envie non plus d’y entrer 😁

avatar malcolmZ07 | 

Pas de commentaire de symich ... ça ne m'étonne pas

avatar Yves SG | 

La vraie solution serait à mes yeux, qu’Apple décide de développer son propre moteur de recherche, et dame le pion à Google.
La tâche est ardue mais je n’ai aucun doute sur la capacité d’Apple à réaliser cela, ils l’ont fait dans bien d’autres domaines plus difficiles !
Ça prendrait quelques années, et probablement une décennie avant que les utilisateurs changent d’habitude, mais ça modifierait sacrément la donne sur bien des points !
Malheureusement, il ne semble pas que cela soit la stratégie d’Apple, en tout cas pour l’instant…

avatar debione | 

Bof, entre ça et Apple capable via icloud d'activer les micro des smartphone avant les conversation...
Toute personne possédant un smartphone est potentiellement espionable en un clic... Ah non, en fait même pas un clic... 😋

avatar malcolmZ07 | 

@debione

Source ?

avatar debione | 

Fait une petite recherche dans les articles de macg, ils en ont parlé (les micros qui s activaient Avant même que l'on répondent)

avatar reborn | 

@malcolmZ07

Il parle de la faille facetime...

Corrigé depuis et rien à voir avec iCloud..

avatar debione | 

Ce n'était pas une faille à proprement parlé et ft passe par les serveur dapple... C'était un réglage foireux qui a bien démontrer que oui Apple peut activer à distance, patriot act obligé je pense.

avatar reborn | 

C’etait un bug, touchant iOS à partir de la version 12.1 . Et cela n’a rien mais alors rien à voir avec le patriot act.

avatar stipus | 

L'intelligence artificielle, c'est surtout une très mauvaise traduction du terme anglais Artificial Intelligence. C'était trop facile de traduire de cette façon....

Mais en anglais l'intelligence c'est les services secrets, la capacité à gérer et trier l'information, ce que font de mieux en mieux ces systèmes d'intelligence artificielle. Mais ce n'est pas pour cela qu'ils ont le moindre brin d'intelligence.

S'il y avait vraiment de l'intelligence la dedans, en anglais cela s'appellerait de l'Artificial Smartness ou Artificial Cleverness.

Pages

CONNEXION UTILISATEUR