Apple dévoile le fonctionnement de « Dis Siri », et un peu de son avenir

Mickaël Bazoge |

Apple a ajouté à son blog sur l'apprentissage automatique un nouvel article consacré à la personnalisation de « Dis Siri ». Cette fonction, apparue avec l'iPhone 6, a gagné son indépendance par la suite : depuis l'iPhone 6s, il n'est plus nécessaire de brancher le smartphone au courant pour convoquer l'assistant de la sorte. Depuis, « Dis Siri » est disponible sur l'iPad, l'Apple Watch, le HomePod, et demain qui sait… les AirPods ?

L'article, très technique, s'intéresse à la problématique de la reconnaissance de l'ordre vocal initial, qui permet à l'appareil de détecter la demande de l'utilisateur. Apple explique que le choix de la phrase « Hey Siri » s'est fait naturellement : en fait, les utilisateurs s'en servaient déjà quand ils lançaient l'assistant « à la main ». En français, c'est peut-être moins évident : « Dis Siri » parait plus ampoulé.

Le constructeur a identifié trois scénarios susceptibles d'activer Siri sans que l'utilisateur ne l'ait désiré : quand ce dernier dit une phrase similaire (du type « are you serious » ou « in Syria today ») ; quand un autre utilisateur lance « Dis Siri » ; quand un autre utilisateur dit une phrase similaire. Le travail d'Apple a été de s'assurer que l'assistant ne s'active que lorsque c'est bien l'utilisateur principal qui dit « Dis Siri ».

Cela passe par un processus que l'on connait bien : il se lance à chaque configuration initiale d'un iPhone ou d'un iPad, il s'agit de dire tout haut cinq phrases explicites : « Dis Siri » trois fois, « Dis Siri, quelle est la météo aujourd'hui » et « Dis Siri, c'est moi ». Malgré tous ces efforts, force est de constater que ce n'est pas encore tout à fait au point et que l'assistant se lance parfois au détour d'une conversation ou quand un collègue fait une blague.

Apple explique vouloir aller plus loin, en imaginant un avenir où il ne serait pas nécessaire d'en passer par le processus d'enregistrement d'un ensemble de phrases. L'utilisateur n'aurait qu'à dire « Dis Siri » pour que l'assistant se lance tout naturellement ; ce dernier affinerait la reconnaissance de la voix de l'utilisateur de manière organique, au fur et à mesure des requêtes « Dis Siri ».

Le constructeur écrit également que la reconnaissance de la voix demeure un défi dans les environnements bruyants. Dans ce domaine, le HomePod apporte une réponse avec sa palanquée de micros : l'enceinte accroche parfaitement l'ordre vocal « Hey Siri » même quand on le prononce à voix basse, ou quand il y a du bruit dans la pièce.


Pour aller plus loin :
Accédez aux commentaires de l'article