Apple dément avoir entrainé Apple Intelligence sur des sous-titres de vidéos YouTube

Félix Cattafesta

jeudi 18 juillet 2024 à 10:30 • 42

En début de semaine, une enquête révélait comment certaines grandes boites de la tech - dont Apple - utilisaient une base de données basées sur des transcriptions de vidéos YouTube pour former leurs modèles d’intelligence artificielle. Cette source de près de 900 Go a été créée sans le consentement des vidéastes, ce qui n’a pas manqué de faire polémique. Apple a aujourd’hui clarifié les choses auprès de 9to5Mac : si elle a bien utilisé cet ensemble de données pour mettre sur pied son modèle open source OpenELM, le moteur ne sert pas à faire carburer les fonctions d’IA de son écosystème.

La base de données en question contient des textes tirés de plus de 48 000 chaînes pour un total de 173 536 vidéos. Parmi eux, de grands noms comme PewDiePie, MrBeast ou différentes émissions comme les Late Show de Stephen Colbert, John Oliver ou Jimmy Kimmel. L’affaire avait fait du bruit étant donné que les vidéastes n’étaient pas au courant de la réutilisation de leur travail. Certains youtubeurs comme MKBHD ont réagi dans la foulée via une vidéo.

Le modèle entrainé par Apple à l’aide de cette source est OpenELM, un modèle open source disponible sur GitHub pensé pour ne pas prendre trop de place et tourner localement. La page Github explique que les différents modèles OpenELM ont été « entraînés sur des ensembles de données publics » et que leur publication « vise à renforcer et à enrichir la communauté de la recherche ». Dans sa déclaration faite à 9to5, Apple affirme qu’elle n’utilise pas ce moteur pour ses fonctions d’IA ou pour le futur Apple Intelligence. Elle précise qu’elle n’a pas prévu d’en créer une seconde version.

Apple n’est pas la seule à s’être appuyée sur cette base de données : Google utiliserait les vidéos de YouTube pour ses IA, tandis qu’OpenAI aurait également moissonné la plateforme pour créer son modèle Sora. Depuis quasiment un an, Apple publie régulièrement des modèles de langage open source : on a par exemple vu arriver Ferret ou Matryoshka Diffusion pour ce qui est de la génération d’images.

Pour aller plus loin :

Soutenez MacGeneration sur Tipeee

MacGeneration

iGeneration

WatchGeneration

Services

Rejoignez le Club iGen

Apple dément avoir entrainé Apple Intelligence sur des sous-titres de vidéos YouTube

Pour aller plus loin :

Précommandez le livre et rejoignez la fête

Actualités

Apple accélère la promo pour la F1 dans Plans

Privacy Display : l’écran privé du Galaxy S26 Ultra en met plein la vue

Belkin, mophie, Moft : Apple élargit sa sélection d’accessoires sur l’Apple Store

Promo : une litière auto-nettoyante connectée à 360 €

Tado° optimise son thermostat X pour les pompes à chaleur et le chauffage au sol

Les AirPods Ultra compatibles avec Apple Intelligence et l'intelligence visuelle ?

Samsung présente ses Galaxy S26 : une évolution plus qu’une révolution, sur fond de crise des prix

Test de la liseuse Xteink X4 : pas vraiment MagSafe, mais vraiment attachante

iPhone Fold : les mesures du pli quasi invisible en fuite

L’App Store semble débordé par la vague du vibe coding

Télécommande perdue ? Amazon enrichit l’app Fire TV sur mobile

Le Snapdragon martien aide la sonde équipée d'un PowerPC G3 à se positionner sans GPS

Promo : l’iPad Pro M5 à prix cassé dès 987 €

SFR va activer prochainement la vraie 5G pour les iPhone

Taïwan : Tim Cook averti par la CIA dès 2023 d’un risque d’intervention chinoise

Les détecteurs de fumée Matter de Heiman sont abordables et maintenant certifiés pour Home Assistant

Image du moment

Tests

Test de la liseuse Xteink X4 : pas vraiment MagSafe, mais vraiment attachante

Test du Hue Bridge Pro : des fonctions qui ressemblent à des gadgets et des défauts pour le pont du futur

Test des ampoules KAJPLATS d’IKEA : encore perfectibles, déjà incontournables ?

Test du Palma 2 Pro de Boox : une liseuse format smartphone sous Android, est-ce une bonne idée ?

Test de l’AirTag 2 : deux fois plus facile à retrouver ?

Re-test de l’iPhone Air : pas si mal l’air de rien