Les podcasts traduits par IA arrivent sur Spotify

Félix Cattafesta |

Spotify expérimente elle aussi avec l'IA. Après un DJ basé sur ChatGPT, l'entreprise vient de dévoiler un programme de podcasts entièrement traduits par l'IA. L'idée est de doubler intégralement le podcast en reproduisant la voix originale et les intonations du créateur.

Spotify explique qu'un tel système permet de reproduire le style du créateur original, ce qui offre une expérience d'écoute plus authentique et naturelle qu'avec un doublage standard. « Un épisode de podcast enregistré en anglais peut désormais être disponible dans d'autres langues, tout en conservant les caractéristiques vocales distinctives de l'orateur », précise l'entreprise.

Les technologies d'IA liées à la reproduction de voix ont grandement progressé ces derniers mois. YouTube va bientôt proposer des doublages générés par IA, tandis que la startup HeyGen a fait du bruit grâce à son système doublant de manière crédible n'importe quelle vidéo. Apple planche aussi sur le sujet et propose aux utilisateurs d'iOS 17 d'enregistrer une copie de leur voix, qui pourra servir à s'exprimer dans les conversations face à face ou via FaceTime.

Accessibilité : comment iOS 17 peut créer une copie de votre voix

Accessibilité : comment iOS 17 peut créer une copie de votre voix

Spotify explique avoir signé un partenariat avec une poignée de podcasters pour traduire leurs programmes. L'entreprise va commencer par une première fournée en espagnol, tandis que des versions en français et en allemand apparaitront « dans les prochains jours et les prochaines semaines ». Une page dédiée recensant les épisodes traduits a été mise en ligne.

La traduction se base sur de nouveaux outils d'OpenAI annoncés ce matin. On y trouve notamment « un nouveau modèle de synthèse vocale », capable de générer une voix « à partir d'un simple texte et de quelques secondes d'échantillon de parole ». La diffusion de cet outil sera limitée, OpenAI voulant éviter que celui-ci ne soit utilisé à mauvais escient.

Tags
avatar oomu | 

" La diffusion de cet outil sera limitée, OpenAI voulant éviter que celui-ci ne soit utilisé à mauvais escient."

mais anéantir l'utilité d'humains est DÉJÀ un usage à mauvais escient.

LE CAPITALISME tout entier (et le communisme) est lui même fondamentalement à mauvais escient.

Il n'y a pas d'échappatoire. Pas de douceur, pas de contrôle. C'est violent, c'est massif, c'est sauvage et ça infecte par toutes les spores de l'activité humaine. Rapidement.

Je suis déjà en train de bricoler depuis les modèles opensources et les projets qui évoluent à grande vitesse un équivalent des outils commerciaux restreints de Openai pour faire dire ce qui m'amuse à Tom Cruise (et à Macron, et tous vos idéologues favoris aussi bien sur...)

OpenAi parle comme si elle était seule et elle même un bon citoyen. Ce n'est pas le cas.

avatar Individu | 

En français, ça donne quoi ?

avatar CorbeilleNews | 

@oomu

S’ils ne sont pas poussés à leurs extrêmes le capitalisme a quand même quelque chose d’égoïste alors que le second a quelque chose de plus noble non ? Rien que dans le nom déjà ?

Les extrêmes sont plutôt une déviance pour le communisme alors que c’est plus une amplification du phénomène pour le capitalisme.

Pourquoi le communisme ne peut-il être perçu autrement que sans cette déviance alors que le glissement du capitalisme est plus subtil et peut se faire au détriment même de ceux qui le prônent ?

avatar oomu | 

"Do you dream of a world where some of the top podcasts would be spoken in your native language?"

I never dreamed that.

avatar Individu | 

Ben c'est cool. Mais moi si (et d'autres), ne maitrisant pas l'anglais à la perfection. 🙄

avatar Urubu | 

@Individu

Apprends l’anglais sinon, c’est de loin la langue la plus simple du monde.

avatar Ruben715 | 

@Urubu

L’anglais est justement très loin d’être la langue la plus facile à apprendre. Avec sa phonologie très large, sa grammaire incohérente et ses prononciations aléatoires, c’est assez osé d’affirmer une chose pareille. Parmi les langues bien plus faciles à apprendre, on peut citer l’italien et l’espagnol qui ne souffrent pas d’incohérence grammaticale et phonologique, le chinois mandarin qui n’a même pas de conjugaison, ou encore l’espéranto pour sa régularité stricte.

avatar ClownWorld 🤡 | 

Les podcasts français sont si inintéressants qu’on cherche à traduire les anglais, parce que j’imagine que c’est pas pour les podcasts lettons

avatar Glop0606 | 

D'un côté mes yeux brillent devant tant de prouesses technologiques. De l'autre je sais que c'est pas le meilleur pour nous. La facilité ne rime malheureusement pas avec facultés intellectuelles. Les facultés mémorielles se sont reduites avec Google, là ce seront les facultés cognitives. Je jette pas la pierre à la technologie mais c'est bien d'être conscient des problèmatiques.

avatar Seb42 | 

@Glop0606

🙏👍
Moi je la jette volontier la pierre à l’IA cognitive

CONNEXION UTILISATEUR