Chez Google aussi de petites oreilles écoutent les enregistrements audio de l'Assistant

Florian Innocente |

Après la diffusion d'un documentaire sur le traitement des données obtenues par ses assistants, Google a voulu relativiser la place accordée à des personnes dans l'écoute et l'analyse de ces contenus. Une communication qui laisse des questions sans réponse.

Dans un billet, Google affirme que les experts qu'il fait travailler aux quatre coins du monde, pour écouter et retranscrire des extraits audio, ne travaillent que sur 0,2% environ de cette masse de données. C'est déjà une indication mais l'Assistant de Google traite probablement des millions de requêtes par jour : les petits pourcentages peuvent faire de grandes rivières.

Présentation à la presse du Google Nest Hub

Google ajoute que des précautions sont prévues pour dissocier ces enregistrements des comptes utilisateurs, de manière à les anonymiser. Ces employés ont pour instruction de ne coucher par écrit que les instructions données explicitement à l'assistant, pas les propos qu'ils pourraient entendre en arrière-plan.

Google affirme aussi avoir ouvert une enquête au vu de la rupture du contrat de confidentialité dont a été coupable cet employé, interviewé masqué pour une émission diffusée en Belgique.

Cette communication esquive toutefois des questions soulevées par ce documentaire signé VRT NWS. On y voit que Google emploie des prestataires à travers le monde pour écouter des extraits audio qui leur sont envoyés en grands volumes tous les mois. Le témoin de l'émission dit en traiter environ 1 000 par semaine.

Ces opérateurs ont pour mission de les retranscrire, afin d'améliorer les capacités d'analyse de l'assistant. Déjà, Google ne prévient nulle part dans ses conditions d'utilisation qu'elle sous-traite ces informations, ou tout simplement qu'elle les confie à des personnes pour écoute.

Autre problème, ces enregistrements ont beau être séparés de l'identité de ceux qui les ont provoqués, il arrive fréquemment que l'assistant capte par erreur des propos qui ne lui étaient pas destinés.

Tous ceux qui utilisent les assistants d'Apple, de Google ou d'Amazon ont été confrontés à ces réveils impromptus de ces logiciels, alors qu'on ne les avaient pas appelés. L'assistant comprend mal et croit avoir entendu un "Dis Siri" ou un "Alexa", alors que non. Pour ajouter à ces problèmes déjà courants, la personne interrogée explique que l'assistant de Google a des progrès à faire en flamand et que les erreurs d'interprétation pour détecter correctement un "Ok Google" peuvent aussi s'expliquer par ce biais.

L'interface utilisateur pour écouter ses propres enregistrements et les effacer

Le journaliste raconte ensuite que sur un peu plus de 1000 enregistrements passés en revue, il en a compté 153 qui avait été captés par erreur par l'assistant et livrés pour retranscription. De là découle un autre problème, ces enregistrements impromptus peuvent contenir des informations plus personnelles puisque la personne ne s'adressait pas à son enceinte.

Le journaliste est allé à la rencontre d'un couple et d'un homme dont les adresses ou noms étaient présents dans ces extraits audio. Chacun a pu confirmer qu'il s'agissait bien de sa voix ou de celle d'une personne dans la maison. D'une manière plus générale, même si l'assistant a correctement réagi à une demande, il peut fréquemment récupérer des infos telles que des demandes de rendez-vous chez un médecin, des noms ou adresses, qui tomberont peut-être dans les oreilles de ces employés.

L'opérateur raconte avoir écouté un jour un fichier audio dans lequel une femme semblait en détresse, peut-être violentée. Que faire lorsque cela se produit, comment réagir ? Les consignes de Google n'abordent pas ce genre de situation, constate-t-il désabusé. Et de réaliser à ce moment-là que ce ne sont plus seulement des voix qui sont écoutées à la chaîne, mais des personnes dans leur quotidien.

Le logiciel d'écoute et de retranscription utilisé par les prestataires de Google

La critique faite à Google porte avant tout sur l'absence de transparence sur les coulisses de l'analyse de ces données. Sur l'implication de personnes en chair et en os, pas toujours employées par Google, qui écoutent ces échanges. Alors que peut-être beaucoup de ces propriétaires d'enceintes intelligentes croient que leurs voix ne sont traitées que par des ordinateurs et logiciels.

Ce sujet fait écho à des questions similaires à propos d'Amazon qui s'appuie lui-aussi sur l'oreille d'êtres humains pour améliorer Alexa, avec des problématiques identiques.

Accédez aux commentaires de l'article