Scribe utilise l’IA pour transcrire rapidement les vidéos YouTube sur iPhone

Félix Cattafesta |

Scribe est une application pour iOS utilisant les dernières technologies d’IA génératives pour transcrire rapidement des vidéos YouTube. Le fonctionnement est assez simple : vous entrez l’URL de la vidéo avant que le téléphone ne mouline pour vous générer une transcription avec une ponctuation adaptée, des titres et même une table des matières. Il est possible de cliquer n’importe où pour entendre le texte de la vidéo, synchronisé avec la version textuelle.

La transcription d’une vidéo en anglais et sa table des matières.

Cette application sera pratique pour survoler le contenu de longues vidéos sans ses écouteurs à portée de mains, ou encore pour jeter un bref coup d'œil à de grosses interviews. Les transcriptions sont enregistrées sur le téléphone, tout comme les vidéos qui peuvent être consultées simplement en passant son iPhone à l’horizontale. Le traitement se fait de manière rapide.

Le développeur précise que toute la transcription se fait localement sur l’appareil et que son app ne collecte aucune information personnelle. Un petit modèle d’IA est visiblement embarqué pour générer les titres et la ponctuation, ce qui justifie les quelque 750 Mo de l’application. Les transcriptions peuvent ensuite être exportées au format PDF pour être partagées.

La transcription d’une interview en français est automatiquement traduite en anglais (à gauche). L’app fonctionne en revanche plutôt bien pour les contenus en anglais (à droite).

Certaines améliorations restent à effectuer : la transcription se fait automatiquement en anglais, peu importe que votre vidéo soit en français ou dans une autre langue. Il y a donc une transcription doublée d’une traduction, sans option pour choisir précisément ce que l’on veut. L’interface de lecture des vidéos pourrait également être améliorée. Le résultat côté texte n'est pas parfait, mais reste exploitable.

L’app est encore jeune, et on peut espérer que le développeur trouvera moyen d’améliorer ces différents points. Scribe est pour le moment proposé gratuitement sur l’App Store, mais un unique achat in-app est dans les tuyaux afin de monétiser le projet. Le programme fonctionne également sur Mac M1 ou directement via un site web, le traitement étant effectué par le navigateur.

avatar jerssrk | 

Si quelque connaîtrait un site qui me permetttait de convertir des vidéo tuto en anglais en voix FR.
J’ai regardé sur des sites mais c’est à la minute et vu la dose que je voudrais faire même le tarif entreprise en général à plusieurs milliers de dollars ne serait pas suffisant :(

avatar simnico971 | 

Il y a aussi l'application Aiko qui utilise le modèle d'OpenAI réputé excellent. Disponible dans plein de langues, tout se fait en local (d'où le poids de l'appli, environ 2Go) et c'est paramètre le (traduction en anglais ou non).

Par contre l'application n'est pas actuellement capable d'aller chercher une vidéo YouTube avec un simple lien, elle fonctionne soit avec le micro soit avec un fichier.

Donc il faut passer par le téléchargement de la vidéo avec l'un des sites existants, ça rajoute quelques étapes mais c'est assez rapide.

PS : les autres apps du développeur sont excellentes et valent le coup d'œil, en particulier Actions qui ajoute énormément d'options à Raccourcis.

avatar DarkChocolâte | 

@simnico971

Pas sûr que Scribble respecte les T&C de Google. A moins que les choses aient changé il existe aucune API officielle pour accéder au fichier media d'une video YT. Il faut utiliser des scripts style youtube-dl. A prendre en considération avant de faire l'achat in-app.

Par contre je viens de faire un essai et c'est pas mal, ça permet de survoler rapidement le contenu d'un stream de 2 ou 3h...

avatar DarkChocolâte | 

@DarkChocolâte

Ha mais en fait l'app n'effectue aucune transcription mais reformate le transcript fournit par YouTube... d'après ce que j'ai compris. La récupération par l'app de l'audio de la video reste a mon avis contre les T&C.

avatar Gotmilker | 

Sinon youtube propose nativement la transcription de toutes ses vidéos.

avatar jb18v | 

@Gotmilker

Oui c’est très approximatif quand même ^^

avatar lauraffaire | 

@Gotmilker

Oui, mais ce n’est pas aussi performant… C’est l’équivalent d’un Google translate d’après mon expérience

avatar v1nce29 | 

> C’est l’équivalent d’un Google translate d’après mon expérience

Du coup, ça rajoute un côté comique à la vidéo.

avatar lauraffaire | 

Ne fonctionne pas pour l’instant pour moi sur iOS. rien ne se passe après le collage du lien YouTube, ou en passant par le menu partagé « envoyé vers Scribe » … heureusement que c’est gratos pour l’instant

avatar TheRV | 

Des apps aussi grosses sont véritablement bloquantes sur un iPhone (et un Mac d’ailleurs) vendu avec si peu de mémoire

avatar v1nce29 | 

Plus qu'à passer ça dans une autre AI pour résumer ces discours à leur quintessence.

Tim Cook, Patron d'Apple :
> Bonjour,
> Achetez l'iPhone
> Au revoir

Squeezie, youtubeur :
> Bonjour,
> Au revoir

CONNEXION UTILISATEUR