Une machine neuronale pour améliorer Google Translate
Google Translate est un outil formidable mais à utiliser avec parcimonie — on ne sait jamais trop si la traduction donnée est correcte, si elle fait un contre-sens… ou si elle a un sens tout simplement ! Le moteur de recherche a néanmoins annoncé une nouveauté qui devrait sensiblement améliorer la qualité de ce service.
Google a modifié en profondeur le moteur de traduction en y injectant des techniques de machine neuronale. L’entreprise planche sur le sujet depuis un bon moment, et ses chercheurs sont parvenus à lui faire traduire des phrases entières plutôt que des morceaux de phrases. Cette technique utilise « un contexte élargi » qui aide le service à trouver la traduction la plus appropriée et la plus pertinente. L’objectif est de faire en sorte que la traduction soit la plus proche de celle que produirait un « humain parlant avec sa propre grammaire ».
Huit langues profitent de cette machine neuronale : de l’anglais vers le français, l’allemand, l’espagnol, le portugais, le chinois, le japonais, le coréen et le turc. Cela représente 35% de l’ensemble des requêtes de Google Translate. À terme, Google veut que les 103 langues de son service soient prises en charge de la même manière.
Bonne nouvelle! Les traductions étaient vraiment mauvaises. Personnellement j'utilise Linguee qui est pas mal pour avoir la traduction de mots ou expressions dans différents contextes.
Effectivement Linguee est une excellente appli !
Ils ont leur propre NDD en .google
Ça va bien chez eux
Cela serait bien de déjà comprendre le contexte, ou que l'utilisateur lui dise.
@rikki finefleur
La méta-analyse de contexte est un des problèmes les plus ardus en traduction automatisée. C'est d'ailleurs une difficulté majeure pour un traducteur humain, des qu'il doit rendre compte du cadre de référence élargi.
Exemple : la phrase de Trump « I'll ask Apple to make all its iPhones in America » se traduit en chinois par « Xiaomi Huawei ».
@occam
XPTDR ??????
Moi qui pensait qu'ils faisaient appel au deep learning depuis des années pour ce produit ! Ça annonce une amélioration considérable de la traduction (qui est honnêtement déjà pas mal) !
Bonne nouvelle , c'est pour bientôt le babelfish alors :)
Seulement 35% des requêtes pour les langues qui doivent représenter 90% de la population, amusant
Ce n'est pas le même calcul.
Les requêtes de traduction c'est d'une langue vers une autre. Les 35% représentent donc des combinaisons de 2 langues.
Les combinaisons possibles avec les 8 langues sont au nombre de 49.
10404 combinaisons avec les 103 langues.
35% des requêtes sont donc composées des 49 combinaisons parmi les 10404 possibles.