Ces oreilles françaises qui écoutaient les enregistrements de Siri

Florian Innocente |

Dans un article consacré aux écoutes, par des personnes, des séquences audio enregistrées par les assistants intelligents, le Canard Enchaîné a discuté avec des employés d'un sous-traitant d'Apple.

L'entreprise, présentée comme « l'un des leaders mondiaux de la traduction automatique », faisait travailler une trentaine de français à Prague. Des personnes embauchées pour 6 mois et payées 10 $ de l'heure (environ 9 €).

Ce programme baptisé « Cosmos » consistait, comme chez Google, Facebook ou Amazon, à écouter des séquences audio captées par Siri depuis les différents appareils d'Apple, et de les comparer avec une traduction textuelle dont il fallait vérifier qu'elle correspondait. Le tout pour affiner à la main l'intelligence de Siri.

Ce témoin dit avoir été « surpris par le nombre de déclenchements accidentels de Siri, beaucoup plus élevé que ne l'avait annoncé Apple ». Plus que l'iPhone c'est le HomePod qui était prompt à reconnaître à tort et à travers des "Dis Siri" qui n'en étaient pas.

Avec comme corollaire, des bribes de conversations sans lien aucun avec un ordre donné à l'assistant, qui étaient interceptées dans l'intimité des foyers. « Le pire, c'était les montres connectées : on tombait parfois sur les dialogues chez le médecin ou dans les cabinets d'avocats », ajoute-t-il.

Soumis à des règles de confidentialité strictes, ces employés ne se privaient pas de tuer le temps en essayant de retrouver l'identité des personnes entendues. Ces informations sont masquées, comme le martèlent sans cesse les concepteurs de ces assistants, en oubliant opportunément que les infos privées peuvent être dans l'enregistrement audio écouté…

Ils se débrouillaient donc avec ce qui était entendu dans l'enregistrement « qui pouvait durer jusqu'à une minute, [avec] la géolocalisation de l'appareil ou encore les noms contenus dans le répertoire téléphonique qui s'affichait sur notre écran ». Un dernier point qui, à lui seul, mériterait des explications d'Apple s'il est avéré.

En plus des captations légitimes ou accidentelles de Siri, plusieurs employés ont dit au Canard avoir travaillé sur des enregistrements provenant de la fonction dictée vocale dans Messages, celle avec laquelle on dicte ses SMS. En somme, Apple n'aurait pas fait différemment de Facebook qui a admis, il y a peu, avoir fait écouter des échantillons audio captés dans Messenger. Sollicitée, la Pomme n'a pas donné suite aux questions de l'hebdomadaire.

Début août, Apple a annoncé qu'elle suspendait provisoirement ces programmes en cours à travers le monde. Elle promettait une future option pour refuser plus facilement tout partage de ces données. Est-ce qu'elle profitera de ce que lui permettent ses considérables ressources, pour aller jusqu'à internaliser ces opérations, de manière à mieux les contrôler ? C'est une autre question.

[MàJ à 17h30] : Apple a annoncé une refonte de son programme et notamment le recours à des employés en interne.


Tags
avatar SyMich | 

"...Un dernier point qui, à lui seul, mériterait des explications d'Apple s'il est avéré...."
Mais Apple ne s'en cache pas! Il suffit de lire le "Guide de sécurité iOS":
"To facilitate Siri features, some of the user’s information from the device is sent to the server. This includes information about the music library (song titles, artists, and playlists), the names of Reminders lists, and names and relationships that are defined in Contacts. All communication with the server is over HTTPS.
When a Siri session is initiated, the user’s first and last name (from Contacts), along with a rough geographic location, are sent to the server. This allows Siri to respond with the name or answer questions that need only an approximate location, such as those about the weather."

(Ou dans la version française à partir de la page 80 https://www.apple.com/fr/business/site/docs/iOS_Security_Guide.pdf )

Pour contrôler la pertinence des réponses apportées par Siri, il est logique que les "oreilles humaines" disposent des MEMES informations...

avatar Florian Innocente | 

@SyMich

Pour contrôler la pertinence des réponses apportées par Siri, il est logique que les "oreilles humaines" disposent des MEMES informations...

Oui mais c’est justement le problème en fait.

avatar SyMich | 

Bien sûr que c'est le problème... quand Apple martèle que ce qui est dans l'iPhone reste dans l'iPhone et qu'on "découvre" que des informations ultra personnelles de notre carnet d'adresse peuvent être transmises à d'obscurs sous-traitants dont on n'a aucune idée de ce qu'ils peuvent faire des infos récupérées (j'ose espérer que ces sous-traitants avaient juste la visualisation à l'écran des infos, celles-ci restant sur les serveurs d'Apple sans aucune possibilité de les copier...)

Je m'étonne juste que vous ayez senti le besoin d'écrire que ce point nécessiterait confirmation.

avatar elitelazor | 

Comment Apple a pu marteler de la com « privacy is king » tout en sachant cela... très déçu !

avatar Kimaero | 

@elitelazor

💰💰💰

avatar Louis_EYE | 

@Kimaero

Non juste obliger de faire ça comme tout les autres

avatar mouahaha | 

Apple et ses fanboys passent leur temps à nous dire qu'apple n'est pas comme les autres pourtant. Je comprends plus la :)

avatar sangoke | 

Punaise, ils viennent de faire une chute dans mon estime !!! Ça balance à tout bout de champs que la confidentialité c’est leur priorité et ils envoient notre géolocalisation et notre répertoire avec nos conversations a des mecs qui s’amusent à retrouver qui a dit quoi ??? 👏🏻👏🏻. Heureusement je ne me sert jamais de Siri (activé juste pour CarPlay) ni de « dis Siri » qui est désactivé. Par contre il m’arrive d’utiliser la dictée vocale pour certains messages et de savoir que ça aussi c’est envoyé alors qu’il n’y a aucune intelligence artificielle à améliorer dans ce cas là, ça me gêne, va falloir rendre des comptes. On peut déposer des plaintes ? Des recours ? Auprès de qui à part la CNIL ?

avatar Ios_What a joke | 

@sangoke

Dèjà de base, le simple fait de mettre par défaut le nom du propriétaire en identifiant de l’appareil et de le fournir à tous les réseaux sur lequel tu te connectes, c’est pas très “privacy friendly”.

avatar sangoke | 

@Ios_What a joke

Merci pour les conseils mais qui te dis que c’est le cas ? Sur les réseaux sociaux je ne suis jamais sous mon patronyme, sur mon identifiant Apple si vu que ça sert aussi de données de facturation ou d’expédition quand tu commande sur le store, pas trop le choix, sinon faut utiliser deux différents, un pour commander et l’autre pour son téléphone c’est vrai mais je n’avais pas été à ce point parano, surtout quand on te vente la confidentialité à tout bout de champs et que tu paie le prix fort en te disant que tu sera tranquille, force est de constater qu’on ne peut vraiment faire confiance à aucune boîte quelle qu’elle soit

avatar Ios_What a joke | 

@sangoke

Je me suis mal exprimé. À chaque configuration d’un appareil, Apple associe l’identifiant de l’appareil avec le nom du profil utilisateur créé.

Par exemple “Iphone de François”. Cet identifiant est partagé à chaque connexion avec un autre appareil (scan Bluetooth, appareil Bluetooth, réseau wifi, etc...)

L’habitude d’Apple d’inclure par défaut des données personnelles dans cet identifiant est en fracture totale avec sa politique (mensonge apparement) sur la confidentialité.

avatar mmenfin | 

@sangoke

C’est pas TOUT ce qui est dicté à Siri qui est écouté hein. C’est juste une partie des requêtes qui partent pour analyse.

avatar sangoke | 

@mmenfin

Ah ça va alors 😅

Comment peux-tu en être sûr ?

avatar mmenfin | 

@sangoke

« Des échantillons ». Ça a toujours été dit.

avatar sangoke | 

@mmenfin

On nous a toujours dit qu’Apple avait pour mot d’ordre la sécurité et la confidentialité, force est de constater que de multiples failles plutôt très graves sont trop souvent décelées, la dernière en date avec iOS 12.4 qui a rouvert une faille normalement corrigée depuis plusieurs versions...

Comment croire ce qu’ils ont toujours dit alors que le contraire est prouvé régulièrement ?

avatar sangoke | 

@mmenfin

On nous dit aussi régulièrement que toutes les données récoltées sont anonymisées... la preuve, y’a même le carnet d’adresse et la géolocalisation, quand à l’anonymisation, comment font-ils pour des données vocales ??

avatar bibi81 | 

comment font-ils pour des données vocales ??

Ils ne font pas, et c'est là tout le problème.

avatar Mrleblanc101 | 

@sangoke

Et tu crois que la retranscription fonctionne comment si ce n'est pas de l'intelligence artificielle, par onde magique de licornes albinos ?

avatar sangoke | 

@Mrleblanc101

Allez allez retourne te coucher tu t’es levé trop tôt visiblement. Ça fait des années que ce genre de solution text to speech ou speech to text existe, l’intelligence artificielle quelques années seulement et ça n’a rien à voir avec de l’intelligence artificielle...

Bonne nuit

avatar Mrleblanc101 | 

@sangoke

Clairement tu n'y connais rien 😂

avatar sangoke | 

@Mrleblanc101

Voilà comme ça t’es content. Fais dodo gamin

avatar Mrleblanc101 | 

@sangoke

Oh comme c'est mignon, tu as absolument besoin d'avoir le dernier mot même si tu n'as aucune idée de quoi tu parle ?

avatar sangoke | 

@Mrleblanc101

Non non justement j’en ai rien à foutre. T’as raison. T’es content. Tout va bien. Ciao

avatar Mrleblanc101 | 

@sangoke

Non, définitivement ça te titille sinon tu aurais arrêter de répondre !

avatar mouahaha | 

Donc on aurait déjà eu de l'IA sur windows 95 avec DNS... ?

Ya pas besoin d'IA pour analyser la dictée... SI intel avait su, elle aurait pu faire un pub sur le pentium qui accélère l'IA au lieu d'internet...

avatar Poweruser75011 | 

10 Euros de l’heure c’est très bien à Prague 😇

avatar Poweruser75011 | 

On postule ou?

avatar Poweruser75011 | 

On nous disait que Siri était à chier comparé à Google assistant ou Alexa puisque Apple utilisait pas nos donnés pour s’améliorer ... du coup je me demande où est la vraie raison

avatar Lemmings | 

@Poweruser75011 : hahaha

avatar bibi81 | 

Apple est obligé de répondre à la concurrence avec son propre assistant. Mais comme l'assistant ne rapporte pas d'argent à Apple, pas de raison d'investir dans un bon assistant.

avatar lil0 | 

Ce n'est pas pour cette raison que Google assistant est devant. Aujourd'hui Siri rivalise avec Alexa, mais tous sont à la traîne sur Google assistant pour la simple raison que le deep machine learning et les technos du BigData sont les spécialités de Google(moteur de recherche...) et ce avant même l'arrivée des assistants sur le marché.

avatar 8enoit | 

@Poweruser75011

🗣 « Dis chérie » => 🔴🎤 => ↗️☁️↘️ =>👂🏼 => 🗒✍🏼 => 

avatar Osei Tutu | 

@8noit
J’ai déjà vécu cette situation 😂. Quel ne fut mon étonnement d’entendre Siri me dire qu’il n’avait pas compris ma requête ! J’ai désactivé ok Google pour la même raison, un ok entendu et il pense être convoqué

avatar lil0 | 

Qu'il s'agisse de Siri, Google assistant, Alexa ou autre, tous fonctionne grâce au machine learning qui nécessite des données. Il faut une ÉNORME quantité de données servants d'exemple afin que ces systèmes puissent reconnaître n'importe quelle voix, accent, intonation.
La naïveté de certains était de croire qu'Apple développait Siri sans rien, par magie.

C'est pareil pour nos photos sur iCloud/Drive/OneDrive, elles servent d'exemple pour entraîner des algos de reconnaissance d'image. D'ailleurs, si vous lisez bien les conditions d'utilisation, c'est marqué que vos photos servent à améliorer le service, ce qui est vrai.

avatar p@t72 | 

😎🍿🍿🍿

avatar Mr_Cobb | 

Avec le HomePod proche de la télé, je compte plus les fois où il se lance sans que nous le sollicitons. Encore hier, la musique c’est lancer toute seule, le bond qu’on a fait dans le canapé avec Bob Marley a font dans l’appart à 22h. 🙄

avatar Lemmings | 

@Mr_Cobb : à fond tu voulais dire ? :D

avatar Mr_Cobb | 

@Lemmings

Oupss 😅

avatar Ios_What a joke | 

Ça sue par ici..

avatar Crkm | 

Comment ça, vous voulez dire que le discours sur la vie privée chez Apple n’est que du marketing bidon sans aucune substance ? Oulala, c’est surprenant ça dites donc.

En attendant, le réveil va être dur pour les fanboys 🙂

avatar bibi81 | 

En attendant, le réveil va être dur pour les fanboys 🙂

Chut, ne le dit pas trop fort tu vas les réveiller. Ils rêvent encore...

avatar iboy | 

@bibi81

Lol toi t’es pas très logique je préfère être écouté pour affiner les réponses de l’assistant que d’être écouté pour ensuite être vendu sans vergogne a des boites de marketing . C’est les fanboy d’android les pigeons dans l’histoire... Nous ou nous écoute pour améliorer le service, vous on vous écoute pour vous vendre ensuite a des boites qui vont utiliser vos données pour vous vendre des produits en fonction de vos questions, emplacement , déplacement et j’en passe ...

avatar bibi81 | 

Lol toi t’es pas très logique je préfère être écouté

Non je ne suis pas écouté moi...

vous on vous écoute pour vous vendre ensuite a des boites qui vont utiliser vos données pour vous vendre des produits en fonction de vos questions, emplacement , déplacement et j’en passe ...

... justement parce que Google a clairement dit que ses services étaient aussi utilisés pour des raisons mercantiles.

Au fait, est-ce que tu es courant qu'il est possible avec Google de lui demander de ne pas vendre ton profil publicitaire ? (Et donc de ne pas commercer avec tes données privées)

avatar iboy | 

@bibi81

Au faite tu sais qu’il est possible de désactiver l’écoute constante d’un Dis Siri pour ne pas être espionné ??

Au final l’Apple fanboy est utilisé pour améliorer le service alors que l’Android fanboy est utilisé pour faire un max de bénèf le choix est vite fait même si tu me sors Google l’assume au final c’est 100x pire 😉

avatar bibi81 | 

Au faite tu sais qu’il est possible de désactiver l’écoute constante d’un Dis Siri pour ne pas être espionné ??

Mais pour quoi faire puisque tout ce qui se passe sur l'iPhone reste sur l'iPhone ?

Au final l’Apple fanboy est utilisé pour améliorer le service

En effet et on lui a dit le contraire.

même si tu me sors Google l’assume au final c’est 100x pire 😉

Pour toi peut-être, et tant mieux pour toi.

Moi je préfère l’honnêteté, chacun son truc ;)

avatar iboy | 

@bibi81

Toi savoir lire ?

https://www.apple.com/fr/business/site/docs/iOS_Security_Guide.pdf
« Les enregistrements vocaux de l’utilisateur sont conservés pendant six mois, afin que le système de reconnaissance vocale puisse les utiliser pour mieux comprendre la voix de l’utilisateur. Une autre copie est enregistrée après six mois, sans son identifiant, afin qu’Apple puisse l’utiliser pour améliorer et développer Siri, et ce, pendant deux ans au total. Un petit sous‐ensemble de fiches, transcriptions et données associées sans identifiant sont susceptibles de continuer à être employées par Apple pour l’amélioration continue et le contrôle de qualité de Siri au‐delà de deux ans. »

Tu disais ?

avatar iboy | 

@bibi81

Donc je répète je préfère être utilisé en toute transparence pour améliorer un service que d’être vendu comme un vulgaire portefeuille sur patte au plus offrant de façon transparente ou pas :)

avatar Godverdomme | 

As tu deja regardé les communications de Apple sur la vie privée ???
Je comprends parfaitement ton pseudo

avatar iboy | 

@Godverdomme

Oui et ?

avatar Godverdomme | 

Ils communiquent en disant le contraire de la réalité, en en font leur premier argument publicitaire, ce n'est pas un problème pour toi?

Pages

CONNEXION UTILISATEUR