iOS 10 : il faudra activer les fonctions de privacité différentielle

Mickaël Bazoge |

Comment proposer aux futurs utilisateurs d'iOS 10 des suggestions précises et pertinentes dans Messages, sans que leur vie privée en soit affectée ? Le constructeur s'en est expliqué durant la WWDC : il exploite des techniques de privacité différentielle (« differential privacy »), qui permettent d'exploiter des données sans pouvoir identifier précisément l'utilisateur (lire : « Privacité différentielle » : comment Apple collecte vos données sans collecter vos données). La privacité différentielle émarge dans le domaine de la statistique et de l'analyse des données « qui respecte parfaitement l'intimité des données individuelles », a expliqué Craig Federighi.

Cliquer pour agrandir

Apple a donné à Recode quelques détails supplémentaires sur la mise en œuvre de cette technique : elle fera ses débuts avec iOS 10, mais elle n'ira pas piocher dans les photos de l'utilisateur stockées dans le nuage d'iCloud pour les fonctions de reconnaissance d'images (ce traitement se déroule en local directement sur l'iPhone ou l'iPad, lire : Photos : Apple copie Google… la confidentialité en plus).

La Pomme n'a pas encore débuté la collecte des données, et plus intéressant encore, les fonctions de privacité devront en passer par l'accord explicite de l'utilisateur (opt-in). Le constructeur fait aussi savoir que la récolte des données se limitera dans un premier temps à quatre fonctions : les nouveaux mots ajoutés au dictionnaire personnel, les émojis tapés par l'utilisateur (afin qu'Apple puisse lui en suggérer d'autres), les liens profonds dans les apps et les suggestions de recherche dans les notes.

Avec la privacité différentielle, Apple tente de trouver un chemin qui lui permet d'offrir des fonctions liées à l'intelligence artificielle, sans avoir à sacrifier la vie privée de ses utilisateurs.

avatar Mrleblanc101 | 

J'ai rarement lu un article aussi mal écrit

avatar Yanouss | 

@Mrleblanc101 :
Dévoues-toi et écris-en un au lieu de critiquer

avatar samised | 

@Yanouss :
Pas le droit de critiquer s'il n'est pas journaliste ou rédacteur ? Pauvre pays où l'idiot a le droit de s'exprimer...

avatar NEWIPHONE | 

@samised :
La moindre des choses est dans un premier temps de respecter le travail accompli. La deuxième étape consiste à s'exprimer dans des termes moins méprisants. La troisième et ultime chose à considérer dans la défense d'une personne qui s'est trompée c'est de lui dire sereinement au lieu d'abonder en son sens.
En résumé tu as sûrement défendu la mauvaise personne

avatar NEWIPHONE | 

@NEWIPHONE :
défendu la mauvaise personne

avatar samised | 

@NEWIPHONE :
C'est quoi cette société où si l'on ose poser une critique alors on est le méchant garçon?! Une critique qu'elle soit constructive ou non à le droit d'exister! Donner son avis et un droit fondamental, que cela plaise ou non! Je ne défend pas son point de vue, seulement son droit à poser à une critique...

avatar C1rc3@0rc | 

@samised
+1

D'un autre coté dans un pays ou la connaissance de ses droits est un délit comment s'en étonner?

"privacité différentielle" a aussi peu de sens que "'intelligence artificielle" autant dans le contexte que dans le langage, autant sur la forme que sur le fond. On est sur des terme marketing inventé par les "think tank" des groupements industriels pour contourner les droits de l'Homme...

Le fait est qu'Apple surveille et espionne l'utilisateur avec ces appareils, que pour des questions économiques et industrielles, les données collectées sont chiffrées selon un systeme qui ressemble plus a de la steganographie et que lui sont ajouter des contre-mesures qu'Apple enrobe sous le terme marketing «d'anonymisation», mais il faut pas se leurrer ces données sont nullement anonymes, elles sont juste protégées de la concurrence.

Quant a l'intelligence artificielle, las, ce terme est appliqué par le marketing a n'importe quel systeme de big data cloudisé. Les algorithmes qui sont derrière Siri sont vieux de plus de 30ans, ne relève pas de l'intelligence artificielle pour le moins du monde, ont des performances très moyennes qui ne sont compensé que par des "astuces" qui ne sont ni plus ni moins que de l'enfumage.
La seule chose réellement pertinente c'est la puissance de traitement et le flux monstrueux de données qui est traité.

Mais dans les fait on est loin, très loin d'une intelligence artificielle conversationnelle et la collecte des données est bel et bien nominative et comportemental, voire biométrique!

avatar marc_os | 

@C1rc3@0rc :
Apple t'a montré les algorithmes derrière Siri ? Coooool !

avatar noooty | 

@Mrleblanc101 :
Ton papa et ta maman sont si méchants avec toi? Du coup, tu compenses ce vide affectif en essayant de t'affirmer d'une façon agressive ?
Ce genre de commentaire est à éviter...

avatar eastsider | 

Et siri en local c est pas plus important plutot??!

avatar C1rc3@0rc | 

@eastsider
C'est surtout pas possible

Siri se base sur 3 composants:
- l'analyseur vocal
- l'analyseur semantique
- la base de donnée (qui n'est pas une base de connaissances!!!)

Pour faire schematique, L'analyseur vocal transforme la voix en texte. Cela est effectué en local par des composants specialisé comme il en existe depuis 20 ans. Des analyseur vocaux, on en avait dans les telephone mobiles y a plus de 10ans.

Apres, l'analyse semantique, prepare la comprehension du texte. C'est a dire que le texte n'est plus une suite de mots independant, mais qu'on y cherche un sens minimaliste: mot cles, forme interrogative et imperative.
Cette forme contextualisé va constituer un "motif" c'est a dire une valeur statistique qui permet de la mettre en correspondance "a peu pres" avec des "motifs" qui servent de cles de tri pour la base de données de reponse.

En clair si tu dis "Siri, donnes moi l'adresse du resto italien le plus proche" on va avoir:
1) transformation en texte de la phrase, ce qui se fait au niveau local
2) transmission du texte aux serveur d'Apple
3) nettoyage de la phrase: addresse, restaurant italien, proche
4) restaurant italien est le motif de base
5) addresse est la propriété
6) proche c'est un motif qui indique la localisation, donc l'information est donné par le GPS
7) le motif de la base de données devient donc "restaurant italien" + perimetre de la donnée GPS
8) suffit alors de sortir la coordonnee GPS du restaurant italien la plus proche de l'iPhone.

A part les point 1 et 2 les reste ne peut se faire que sur les serveurs d'Apple, pour une question de puissance de traitement mais surtout de place. Et de mise a jours. Chaque requete dans Siri enrichi la base de donnée et multiplie les motifs cles.

Si un motif ne trouve pas de correspondance automatique, alors un opérateur humain traite la question et rentre l'information dans le systeme.

avatar XiliX | 

@C1rc3@0rc :

Là expliqué comme ça je suis d'accord avec toi. Conceptuellement c'est assez vieux. Mais les algorithmes ont bien évolué depuis.

Après tout l'apprentissage d'un enfant suis pratiquement la même méthodologie. L'anonymisation en moins. Mais ça reste dans le milieu proche de l'enfant.

avatar DrJonesTHX | 

@eastsider :
1000
Depuis le temps que je demande Siri en local , Cela simplifierait tellement les choses et l'efficacité…

avatar descartes33 | 

Privacité? C'est quoi encore cette anglicisme . Article à revoir .

avatar C1rc3@0rc | 

@descartes33

Privacité n'est pas un anglicisme, c'est un terme marketing.

Le second problème c'est que la notion de vie privée et de donnée privée et de droit d'anonymat sont très different dans la législation americaine et française.

Privacy est déjà dévoyé dans l'usage qui en est fait en américain.
En fait le terme est utilisé pour exprimer le contraire de son sens, ce qui rend la traduction encore plus difficile.
En France on va parler de donnée personnelles, de données publiques et de données permettant d'identifier une personne.

L'intérêt des entreprises est d'obtenir des données permettant d'identifier une personne physique. Le droit, basé sur les droits de l'Homme, interdis par principe de collecter des données permettant d'identifier des personnes physique, a fortiori sans les informer explicitement.

La "privacité différentielle" est une méthode qui collecte des données permettant d'identifier une personne, mais ces données sont "anonymisées" pour sécurisé leurs transmission.
Le problème se pose alors au niveau du stockage et de l'exploitation de ces données: sont elles totalement anonymes ou la méthode d'anonymisation est elle réversible?

Le terme "anonymisation" est lui meme fallacieux parce qu'il indique que la donnée n'a jamais été anonyme...

Si la méthode d'anonymisation est réversible, alors il ne s'agit pas d'anonymisation mais d'un chiffrage et les données sont bel et bien "identifiantes" et doivent donc répondre a un ensemble de lois qui varient d'un pays a l'autre, mais sont aussi la cause d'une responsabilité envers les autorités (la société doit fournir les données et les identités sur requête administrative ou judiciaire)

La "privacité différentielle" qualifie la méthode d'anonymisation ou chiffrement. Le terme est volontairement ambigu et qui ne signifie rien. Mais il est bien pratique pour les marketeu, les avocats et les journalistes qui doivent écrire en peu de mots...

avatar XiliX | 

@C1rc3@0rc :
Non il s'agit bien d'anonymisation. Avec l'introduction de beaucoup d'autres paramètres (bruits) pour brouiller encore plus la provenance de l'information.

En contrepartie, statistiquement, le résultat d'Apple est moins bon que Google par exemple. Apple se contente de 60% de fiabilité...

avatar cecile_aelita | 

Est ce que ce système d'analyse de donnée avec conservation de la vie privée pourra améliorer "plan" et plus précisément les conditions de circulation?
Parce que autant si les POI deviennent vraiment proche de ceux de Google ou waze, faut bien admettre que l'info traffic de plan est vraiment pas top.
C'est dommage c'est la seule chose qui lui manque pour être niquel. :-)

avatar Lemmings | 

Citer wiktionary pour "valider" un néologisme dégueulasse qui n'a qu'une origine douteuse... Franchement :/

Vie privée c'est si DIFFICILE que ça à écrire ?

avatar Mickaël Bazoge | 
Et un commentaire un peu moins comminatoire, c'est si DIFFICILE que ça à écrire ? Excusez le coup de sang, mais bon… Ce mot de privacité n'est pas très beau j'en conviens, mais en l'absence de traduction officielle en français, il faut parfois utiliser des néologismes. Je vais citer Anthony, qui a rédigé le premier article sur le sujet sur MacG : « C'est une réflexion en cours depuis plusieurs années, notamment chez les sociologues, notamment au Canada. « Vie privée », « intimité » ou « confidentialité » ne sont pas toujours équivalents de « privacy » (qui veut souvent dire non pas « vie privée » mais « fait d'avoir une vie privée », « moyens de conserver sa vie privée », « stratégies d'intimité », ou quelque chose avec une périphrase qui commence avec « politique de » et donc me défrise). Et dans le cas de la « differential privacy », j'arguerai que la traduction « intimité différentielle » est fausse. Je suis souvent embêté avec la traduction de « privacy » et à défaut de mieux, le néologisme « privacité » me convient mieux que d'autres solutions qui changent totalement le sens du concept ». Moi ça me conviens et en attendant mieux (la traduction d'Apple en français parle de « Differential Privacy »), il va falloir s'y faire.
avatar bonnepoire | 

Je la trouve très bien cette traduction. Explicite et fidèle, tout ce qu'on demande. Les râleuses ne seront jamais heureuses et c'est bien dommage.

Par contre, ca a un petit côté traduction québécoise qui ne me dérange pas du tout.

avatar XiliX | 

@bonnepoire :

Je suis totalement d'accord.
D'autant plus Anthony l'a expliqué depuis le première article.

Perso moi aussi il m'est arrivé de devoir traduire "privacy", et dans certains contextes, la traduction est beaucoup trop long. Du coup fait perdre le ton et le rythme de la phrase.

Donc merci d'avoir osé utiliser ce mot

avatar Abd Salam | 

@XiliX :
Vous êtes simplement entrain de dire que vous ne maîtrisez pas assez le français pour construire une ou des phrases "légères" et avec du "rythme"...

Ça nous arrive à tous... -J'écris bien nous tous- à force de ne plus penser certains concepts en français !

Nous ne trouvons plus les mots en français de manière fluide et simple...

avatar bonnepoire | 

Quel bourrage de mou!

avatar marenostrum | 

très bonne réponse aux vieux ignares plus haut.

avatar Lemmings | 

@Mickaël Bazoge : Haaaa on voit que j'ai touché juste. Désolé mais c'est tout de même un des mauvais travers de certains journalistes de vouloir toujours utiliser quelques mots savants, réels souvent que dans leur univers.

"comminatoire", c'est joli, c'est un bel exemple. Mais le souci c'est que je n'ai à aucun moment été menaçant il me semble, juste un peu critique il est vrai. Donc du coup ça répond à côté de la plaque, dommage.

Mais pour revenir au sujet, effectivement le terme "privacy" est complexe car ce qu'on y attache est fortement divergent du sens réel. La traduction réelle littérale est bien "intimité", et finalement c'est pas si éloigné que ça du sens réel anglais. Sauf qu'en français, "intimité" est interprété souvent dans son sens de la relation aux autres. Alors que c'est bien une définition exacte de la vie privée, de ce qui touche à la personne en son plus profond.

Je préférerai quelque chose du genre "protection de la vie privée différentielle" du coup, mais c'est dur à caser dans un titre...

On verra bien comment Apple nous traduit ça à l'avenir...

@marenostrum : l'ignare, il préfère ignorer les commentaires de ton genre justement. Je déteste les jugements hâtifs...

avatar Jetel | 

@Lemmings :
Et sinon t'as le temps et choper à côté quand même ? Ça se passe comment ?

avatar Lemmings | 

@Jetel : quel rapport avec le sujet ?

avatar bonnepoire | 

un ignare qui ignore c'est normal...

avatar rikki finefleur | 

@michael .
Collecte de données me parait plus simple. Car c'est ce qui se produit, contrairement à ce qu'avait juré feu tim cook, qu'apple ne le ferait jamais.

Privacité différentielle ne veut rien dire.
Car toutes collectes de données dans le cadre de l'internet n'est pas un bloc, mais souvent un échantillon de données utiles pour celui qui la collecte.

avatar Rez2a | 

@rikki finefleur :
La collecte de données, ça fait bien longtemps qu'Apple le fait et ils ne s'en cachent pas. On a déjà eu pas mal d'exemples concrets pendant les keynotes de ces dernières années, genre ils ont déjà communiqué sur le fait qu'ils savent combien de fois par jour un iPhone est déverrouillé etc.

avatar xDave | 

@rikki finefleur :
Tu as trop abusé de Google. Il existe un autre monde où la donnée peut être utile à l'émetteur !
Si tu n'as pas au minimum une IP comment on te retourne un trajet utile à ta géolocalisation ?
On est pas obligé de savoir qui tu es (In personae) et encore moins d'en faire commerce à un tiers! Surtout quand tu ne sais même pas que ce tiers existe ou peut y avoir accès.
On peut aider quelqu'un sans le crier sur tous les toits !

On comprend mieux pourquoi Google ou Facebook sont si bien côtés en bourse... Ils alimentent les autres requins!
Et Apple ne semble pas jouer le jeu vu les réactions à l'emporte-pièce de Wall Street.

avatar bonnepoire | 

Comme d'hab tu confonds tout.

avatar Yohmi | 

@MickaëlBazoge :
À partir du moment où l'on en fait une expression (ici, deux mots que l'on ne sépare pas), le sens diffère, et il devient inutile de faire ce néologisme grossier ; la combinaison en est déjà un.
Je comprends la réflexion derrière, mais je ne souscris pas à votre conclusion. Il y a certainement une meilleure combinaison que « intimité différentielle », mais ce n'est certainement pas le terme « privacité » qui résout savamment ni élégamment le problème.
 
Il faudrait chercher plus loin, et finalement plus proche du sujet, comme par exemple « collecte dépersonnalisée » ou « apprentissage anonymisé » qui permettent non seulement de comprendre de quoi il s'agit, mais en plus font l'économie d'un nouveau mot qui n'a pas de raison d'être.

avatar Abd Salam | 

@Yohmi :
1
comme on dit.

Comment c'est rafraîchissant de lire des expressions "à la française"...

Plutôt que cette soupe indigeste qui s'efforce de coller au maximum à l'anglais.

Bref, beaucoup de gens font des mauvaises choses de la pire manière et avec les meilleures intentions du monde !

avatar marenostrum | 

le mot vient du LATIN (Privatus > mis à part) et pas de l'anglais.

avatar Yohmi | 

@ marenostrum
Ce n’est pas parce qu’une bonne partie du vocabulaire de la langue anglaise provient de langues qui lui sont antérieures (et donc en partie du latin) qu’il faut pour autant faire ce genre de raccourci. Les racines et le sens qui en dérivent ont évolué chacun de leur côté. En français, la racine « privatus » a donné naissance à privé, privatique, privatisé, privatiste, privatoire, privation… mais pas privacie, ni privacité, et ces termes appartiennent à un champ lexical différent. La racine « regula » a donné « rule » en anglais et « règle » en français, ce n’est pas une raison pour changer le nom des double-décimètres en ruleurs graduatés, ce qui constituerait bel et bien un anglicisme malgré sa latinité.

avatar Lemmings | 

@Yohmi : J'aime beaucoup "collecte dépersonnalisée" très pertinent, simple et parfaitement adapté. Merci !

avatar enzo0511 | 

@MickaëlBazoge :
Pour avoir vécu au Québec, et pourtant étant français je trouve que le québécois est souvent étymologiquement plus proche du vrai français ou de l'ancien français que celui que nous pratiquons en France mais parfois plus logique
Je trouve d'ailleurs ridicule les remarques des vieux aigris du vendredi qui n'ont sûrement rien d'autre à faire en fin de semaine que d'aller grogner alors qu'ils se sont sûrement fait rosser toute la semaine par leur patron, d'autant que la langue française se dégrade de plus en plus en France, on ose critiquer à tout va...
Rappelons que nous autres ici on utilise des mots comme "selfie" ou "hashtag" alors qu'au Québec "egoportrait" et "mot dièse" sont quand même plus français...
Alors bon les donneurs de leçon n'ont qu'à aller se rhabiller ;)

avatar Abd Salam | 

@MickaëlBazoge :
Non, on ne se fera pas à la destruction totale de la langue française !

Nous sommes certes vaincus, mais qu'on ne nous demande quand même pas d'être d'accord !

avatar marc_os | 

@MickaëlBazoge :
Donc, on a un mot anglais dont le sens est difficile à exprimer en français par un seul mot. Donc vous ne le traduisez pas (faire un néologisme ici revient à ne pas traduire.). Croyez vous qu'ainsi le lecteur face à un mot bizarre va deviner tout seul les subtilités que vous avez tenté d'expliquer avec plein de mots ? Non, en général il n'est pas devin !
Je proposerais : « Politique de confidentialité différentielle ».
(Mais ça m'étonnerait que les mathématiciens français n'aient pas trouve un terme adéquat.)

avatar Minileul | 

Les réponses me font penser au forum Gizmodo, où à l'époque, il n'y avait que des commentaires inutiles qui critiquait pour troller

avatar rikki finefleur | 

@Minileul
C'est vrai que que le terme privacité différentielle est parfaitement clair pour les quidams que nous sommes.

Tout le monde n'a pas pas le devoir d'avaler les brouettes marketing de ces boites et de le régurgiter au premier venu passant devant soi.
On comprend mieux les choses qui s'annonce clairement.
Ici c'est de la collecte de données personnelles.qu'il s'agit.
Voyez vous le terme est très simple à comprendre.

avatar Domsware | 

@rikki finefleur :
Hum... Je vous invite à lire l'article qui explique le processus en question.

avatar malcolmZ07 | 

@Domsware :
Il ne faut pas trop en demander à un troll de la pire espèce comme rikiki. Son seul but et de décharger ses nerfs lorsqu'il vient ici.
Il doit avoir un boulot de merde , des enfants en échecs scolaire et une grosse dinde.
Il ne faut pas chercher à "discuter" avec lui, car il a toujours raison. Plus binaire , tu meurs !

avatar iGeek07 | 

@C1rc3@0rc :
Si seulement tu t'étais renseigné un peu pour savoir que le nom "differential privacy" n'est sorti d'aucun département marketing mais directement de l'esprit des chercheurs qui ont travaillé sur ce concept, et l'on appelé ainsi dans leur publication… (d'ailleurs Phil Schiller a même dit que si c'était un département marketing qui avait trouvé le nom, il serait bien meilleur :)

Ensuite tu parles d'anonymisation, alors que justement Apple a estimé qu'anonymiser n'allait pas assez loin vu qu'un profil, même si aucun nom associé à celui ci, restait le profil d'une personne et de son comportement exact, et qu'il y a peut être des moyens pour arriver à associer le nom de la personne à ce profil.
Donc la differencial privacy consiste à ajouter du bruit dans les mesures envoyées pour que les données d'un profil ne soient pas 100% vraies, puisque qu'une partie bruité à renvoyé n'importe quoi. Le truc c'est qu'avec quelques millions de profils bruités, on peut quand même déduire de l'information sur l'ensemble de l'échantillon, malgré le bruit.

Donc dire que "la "privacité différentielle" consiste à anonymiser les données pour leur transmission" est complètement faux, et montre bien que tu ne t'es pas renseigné avant de parler. Mais c'est habituel dans les commentaires sur Internet, c'est beaucoup moins drôle de discuter après s'être renseigné.

avatar xDave | 

@iGeek07 :
Merci iGeek, enfin un qui pige la nuance

avatar enzo0511 | 

@iGeek07 :
1
Merci !!

avatar XiliX | 

@iGeek07 :
J'ai l'impression que tu n'as pas bien compris la notion de "bruits" introduite.
Ils sont bien là pour brouiller la provenance des informations.

Apple peut peut-être créer des profiles en fonction de ces données. Mais ça reste des profiles et pas la source elle même des information.
Ces données sont bien anonymes.

avatar iYoung | 

Tout ce bla bla pour une traduction. Franchement moi je comprends ce dont il parle du coup Molière je m'en fou. Go MacG

avatar marc_os | 

@iYoung :
Ah bon, tu as compris du premier coup toutes les subtilités qui se cachent derrière "privacy" alias "privacité" que Mickaël ne savait pas traduire et n'a pas traduites ?
Fortiche.

Pages

CONNEXION UTILISATEUR