Lors de la conférence SpeechTEK 2010, Microsoft a fait la démonstration des fonctions de reconnaissance vocale de Windows Phone 7. Pour Zig Serafin, en charge de ce projet, « la reconnaissance vocale n'est pas une application séparée [mais] plutôt partie intégrante de l'expérience utilisateur ».
Il a commencé par fustiger l'approche de Google et d'Apple, qui utilisent les icônes comme élément principal d'interface : « la plupart des smartphones utilisent des grilles d'icônes, comme Windows 3.1 ». Il est vrai que Windows Phone 7 s'éloigne de cette métaphore au profit d'une interface assumant clairement le numérique, ne cherchant pas à imiter le réel, mais utilisant la typographie comme structure principale (lire : Interface iPad : Apple se trompe-t-elle ?).
« Quand vous passez à un appareil qui n'a pas un grand clavier, la voix est un complément attrayant », explique-t-il, reprenant et développant l'idée fixe de Bill Gates sur le couple tactile/voix, à l'époque pour les TabletPCs. La reconnaissance vocale est ainsi partie prenante des NUI, les natural user interfaces ou « interfaces utilisateurs naturelles ». Si sur Windows Phone 7, ces NUI sont le tactile et la voix, c'est plutôt l'utilisation de gestes captés par un module Kinect en plus de la voix qui pourront permettre à l'utilisateur d'interagir avec sa XBox, par exemple.
Le directeur marketing de Microsoft Ilya Bukshsteyn a fait la démonstration de quelques commandes vocales : alors que la reconnaissance vocale d'iOS se limite à l'appel et au pilotage de la musique et que celle d'Android est principalement utilisée pour la recherche, celle de Windows Phone 7 veut couvrir tous les aspects du système, le but étant, à terme, de pouvoir piloter toute l'interface à la voix avec du langage naturel.
Bukshsteyn a commencé par une fonction classique, l'appel, pour démontrer les fonctions interactives de ce système : en demandant d'appeler « Paul », le téléphone lui a répondu qu'il connaissait plusieurs « Paul ». Il a alors donné la liste, et Bukshsteyn a pu répondre en donnant le bon nom de famille.
Bukshsteyn a ensuite montré le pilotage de l'interface, lançant l'application Photos par la voix. Enfin, il a montré l'intégration de la reconnaissance vocale au moteur décisionnel Bing : il a demandé un restaurant chinois, et le téléphone a lancé l'interface de recherche locale, affichant les restaurants chinois autour de Bukshsteyn.
Microsoft a acquis les technologies de Tellme Networks en 2007 pour développer cette fonction. Les services de Tellme sont les services les plus utilisés aujourd'hui, notamment dans le domaine des serveurs vocaux, où ils sont utilisés pour répondre à 2,5 milliards d'appels. Dans un premier temps, la reconnaissance vocale se limitera à la recherche, l'appel, et la navigation dans les photos, et sera augmentée au fur et à mesure.
Une partie de la reconnaissance sera faite par le téléphone, qui utilisera certainement un processeur spécifique comme le fait l'iPhone, et une partie sera faite sur les serveurs de Tellme, à la manière de la reconnaissance vocale de Google.
MacGeneration a besoin de vous
Vous pouvez nous aider en vous abonnant ou en nous laissant un pourboire
Soutenez MacGeneration sur Tipeee
iPhone 17 : quel adaptateur secteur pour la recharge filaire plus rapide ?
12:15
• 4
Qualcomm officialise le Snapdragon 8 Elite Gen 5, une fuite montre qu'il bat l'Apple M4
10:49
• 10
iPhone pliable : Apple préparerait une ligne de test à Taïwan
09:58
• 8
Maison sous iOS 26 reprend la gestion automatisée du chauffage de Tado°
08:55
• 27
Encore du stock pour les iPhone 17 (Pro), l’Apple Watch Ultra 3 et les AirPods Pro 3
08:31
• 41
Meta lance les Ray-Ban Meta Display, premières lunettes intelligentes à écran intégré
07:52
• 44
Apple va corriger un problème avec l'appareil photo des iPhone Air et 17 Pro Max
07:51
• 24
iPhone 17 (Pro) : verres trempés, coques et chargeurs déjà en promo dès 10 €
17/09/2025 à 23:30
• 38
Gardez une eau toujours parfaite : testez-la avec ce capteur connecté
17/09/2025 à 21:00
• 0
Avec iOS 26, l’alarme se fait entendre : gros boutons et déclenchement par les apps tierces
17/09/2025 à 20:30
• 30
SwitchBot commercialise deux robots aspirateurs à petit prix et pleinement compatibles avec Matter
17/09/2025 à 19:25
• 20
Revue de tests de l’iPhone Air : le design séduit, les compromis interrogent
17/09/2025 à 16:26
• 126
Revue des tests des iPhone 17 Pro : ils chauffent moins, mais ne réinventent pas la roue
17/09/2025 à 15:50
• 54
Revue de tests de l'iPhone 17 : un choix enfin plus simple face à l'iPhone 17 Pro
17/09/2025 à 15:47
• 43
Les iPhone 18 Pro auraient un A20 gravé très fin et une 5G sans Qualcomm
17/09/2025 à 14:32
• 25
Des supports magnétiques pour iPhone et un chargeur allume-cigare pour la voiture en promotion
17/09/2025 à 14:15
• 4

Test du Kuxiu X33 Pro Max : un chargeur magnétique pour iPad basé sur le Smart Connector

Test du détecteur de fumée MS-1 de Sensereo : Matter via Thread dans un module séparé

Test du Relais interrupteur 1PM de SwitchBot : connecter n'importe quelle ampoule avec Matter

Test de la Razer Kishi V3 Pro XL : une excellente manette-berceau pour iPad, mais à quel prix ?

Test du PlugBug 120 W : un chargeur de voyage qu’on n’oublie pas grâce à Localiser
