Siri a bien des défauts et des absences, mais on ne peut pas reprocher à Apple d’avoir joué petit bras avec son assistant. Le service, disponible dans 36 pays, parle en effet 21 langues. Et le constructeur continue d’en étendre les champs lexicaux, avec l’apport à venir du shanghaïen, un dialecte wu parlé dans la ville de Shanghaï (14 millions de locuteurs tout de même). Dans ce domaine, la Pomme fait mieux que ses concurrents : Cortana, présent dans 13 pays, parle 8 langues. Alexa se contente de deux langues, l’anglais et l’allemand.
Apprendre une nouvelle langue à un assistant n’est pas chose aisée, comme on s’en doute. Microsoft a ainsi mis en place une équipe de 29 personnes pour adapter Cortana aux différents territoires ; au Mexique, c’est un auteur de livres pour enfants qui a rédigé les répliques de l’assistant qui se rapportent spécifiquement au pays, comme l’explique Reuters.
Alex Acero, le patron de l’équipe “langue parlée” chez Apple revient dans ce même article sur le processus d’apprentissage de Siri. Le travail consiste tout d’abord à faire lire à des humains des passages de texte avec différents accents, qui sont ensuite transcrits à la main afin que l’ordinateur ait une représentation exacte des textes parlés. Cette approche se complète de l’enregistrement de nombreux sons provenant d’une grande variété de voix. Tout cela est nécessaire pour bâtir un modèle de langage dont l’objet sera de prédire les séquences de mots.
Apple peut ensuite proposer son mode Dictée dans la nouvelle langue. Le constructeur conserve (tout en l’anonymisant) un petit pourcentage des passages dictés par les utilisateurs, pour le retranscrire par des humains. Une manière d’améliorer sans cesse la compréhension du mode Dictée : avec cette méthode, le taux d’erreur de reconnaissance a diminué de moitié.
Une fois que le volume de données est jugé suffisant, et qu’un acteur ou une actrice lui a prêté sa voix, il est temps de lancer Siri au complet pour les utilisateurs de la nouvelle langue. Apple a mis au point des réponses aux questions les plus communes, tandis que Siri apprend sans cesse des requêtes des utilisateurs, selon Acero. Une mise à jour a lieu toutes les deux semaines, avec de nouvelles réponses et des améliorations. Ce qui doit sans aucun doute représenter un investissement d’autant plus important que les langues prises en charge sont nombreuses.