Apple révèle les émojis les plus populaires en français

Soumis par Mickaël Bazoge le 19h41

Dans une nouvelle étude publiée sur le blog Machine Learning Journal, Apple partage quelques principes qui dirigent l'apprentissage automatique en maintenant la plus grande confidentialité. Il s'agit, vous l'aurez compris, d'une nouvelle explication de texte (la version complète est à consulter ici) sur la confidentialité différentielle, un ensemble de préceptes qui permettent au constructeur de récupérer des données sans réellement les collecter.

Cliquer pour agrandir

Le texte jongle entre l'art des statistiques et les techniques d'analyse de données, ce qui pour le commun des mortels le rend assez indigeste. Les quelques exemples sont plus parlants heureusement. En utilisant les masses de données recueillies (de manière anonyme) auprès des utilisateurs qui l'acceptent, Apple peut améliorer le système de prédiction d'émojis QuickType.

Le constructeur avait déjà détaillé ce principe dans un précédent document, dans lequel on apprenait que les utilisateurs de langue anglaise appréciaient tout particulièrement l'émoji 😂. Dans cette nouvelle fournée, la Pomme livre le classement des émojis les plus utilisés par les utilisateurs français.

Cliquer pour agrandir

Les résultats sont finalement assez proches d'une langue à une autre : 😂 ❤️ 😭 en anglais, 😂 ❤️ 😘 en français. On note aussi qu'il y a moins d'émojis « tristes » ou négatifs dans la langue de Johnny.

La confidentialité différentielle permet aussi à Apple de déterminer quels sont les mots, les expressions et les abréviations les plus utilisés. Il s'agit d'améliorer l'utilisation du clavier ; Apple a aussi découvert grâce à ces techniques que les utilisateurs omettent souvent la dernière lettre à la fin de certains mots (le « e » de « love » par exemple).

Tout cela est bel et bon, mais deux exemples récents ont démontré que même avec la meilleure intelligence artificielle du monde, il arrive que le clavier d'iOS se prenne les pieds dans le tapis en remplaçant automatiquement les « i » par des « A ⍰ ».