Lors de la conférence SpeechTEK 2010, Microsoft a fait la démonstration des fonctions de reconnaissance vocale de Windows Phone 7. Pour Zig Serafin, en charge de ce projet, « la reconnaissance vocale n'est pas une application séparée [mais] plutôt partie intégrante de l'expérience utilisateur ».
Il a commencé par fustiger l'approche de Google et d'Apple, qui utilisent les icônes comme élément principal d'interface : « la plupart des smartphones utilisent des grilles d'icônes, comme Windows 3.1 ». Il est vrai que Windows Phone 7 s'éloigne de cette métaphore au profit d'une interface assumant clairement le numérique, ne cherchant pas à imiter le réel, mais utilisant la typographie comme structure principale (lire : Interface iPad : Apple se trompe-t-elle ?).
« Quand vous passez à un appareil qui n'a pas un grand clavier, la voix est un complément attrayant », explique-t-il, reprenant et développant l'idée fixe de Bill Gates sur le couple tactile/voix, à l'époque pour les TabletPCs. La reconnaissance vocale est ainsi partie prenante des NUI, les natural user interfaces ou « interfaces utilisateurs naturelles ». Si sur Windows Phone 7, ces NUI sont le tactile et la voix, c'est plutôt l'utilisation de gestes captés par un module Kinect en plus de la voix qui pourront permettre à l'utilisateur d'interagir avec sa XBox, par exemple.
Le directeur marketing de Microsoft Ilya Bukshsteyn a fait la démonstration de quelques commandes vocales : alors que la reconnaissance vocale d'iOS se limite à l'appel et au pilotage de la musique et que celle d'Android est principalement utilisée pour la recherche, celle de Windows Phone 7 veut couvrir tous les aspects du système, le but étant, à terme, de pouvoir piloter toute l'interface à la voix avec du langage naturel.
Bukshsteyn a commencé par une fonction classique, l'appel, pour démontrer les fonctions interactives de ce système : en demandant d'appeler « Paul », le téléphone lui a répondu qu'il connaissait plusieurs « Paul ». Il a alors donné la liste, et Bukshsteyn a pu répondre en donnant le bon nom de famille.
Bukshsteyn a ensuite montré le pilotage de l'interface, lançant l'application Photos par la voix. Enfin, il a montré l'intégration de la reconnaissance vocale au moteur décisionnel Bing : il a demandé un restaurant chinois, et le téléphone a lancé l'interface de recherche locale, affichant les restaurants chinois autour de Bukshsteyn.
Microsoft a acquis les technologies de Tellme Networks en 2007 pour développer cette fonction. Les services de Tellme sont les services les plus utilisés aujourd'hui, notamment dans le domaine des serveurs vocaux, où ils sont utilisés pour répondre à 2,5 milliards d'appels. Dans un premier temps, la reconnaissance vocale se limitera à la recherche, l'appel, et la navigation dans les photos, et sera augmentée au fur et à mesure.
Une partie de la reconnaissance sera faite par le téléphone, qui utilisera certainement un processeur spécifique comme le fait l'iPhone, et une partie sera faite sur les serveurs de Tellme, à la manière de la reconnaissance vocale de Google.
Rejoignez le Club iGen
Soutenez le travail d'une rédaction indépendante.
Rejoignez la plus grande communauté Apple francophone !
L’arnaque Doctolib le prouve : il est urgent de reprendre le contrôle sur vos données 📍
11/05/2025 à 20:36
• 0
Deux ans de transition avant une année 2027 remplie de nouveautés ? La semaine Apple
11/05/2025 à 20:36
• 21
Nintendo serre la vis des pirates, quitte à briquer leur Switch
11/05/2025 à 15:00
• 45
Fortnite de retour aux US ? La guerre Apple vs Epic Games semble loin d’être finie
10/05/2025 à 21:20
• 34
Apple Pay maintenant disponible sur le PlayStation Store pour les PlayStation 4 et 5
10/05/2025 à 21:00
• 30
Le nouveau bracelet Sport Pride Edition en photos
10/05/2025 à 18:57
• 34
Le patron par intérim de Sonos aimerait bien avoir la place définitivement, considérant la tempête passée avec brio
10/05/2025 à 15:00
• 53
Sortie de veille : plus de modèles, plus de lancements… l'iPhone serait au cœur d'une stratégie choc
10/05/2025 à 14:00
• 2
Apple pourrait produire au Brésil les iPhone à destination des USA
09/05/2025 à 20:15
• 7
Promo : l'iPhone 16 avec 128 Go chute à 751 € (-218 €)
09/05/2025 à 14:43
• 11
Google Maps permet aussi d’afficher une voiture personnalisée sur CarPlay
09/05/2025 à 14:12
• 11
Hirokazu Kore-eda détaille comment il a tourné son dernier film avec des iPhone 16 Pro
09/05/2025 à 12:00
• 13
Matter 1.4.1 veut simplifier la connexion initiale des appareils
09/05/2025 à 07:56
• 7
La production des SoC des lunettes connectées d’Apple lancée fin 2027
09/05/2025 à 06:23
• 34
DMA : Apple se plaint d'une absence de communication de Bruxelles après son amende de 500 millions
08/05/2025 à 17:30
• 38
Apple Intelligence par la pratique et la démonstration jusqu'en Apple Store
08/05/2025 à 15:45
• 24

Test du Chipolo Pop, le traqueur Bluetooth multi-réseau (Apple ou Google) qui innove

Test d’un détecteur de présence sur piles pour Home Assistant

Test d'un traqueur Bluetooth à moins de 4 € : est-il vraiment aussi bien qu'un AirTag ?

Test d'un adaptateur CarPlay sans fil à moins de 15 €

Test de l’iPhone 16e : pour tout le monde, ou presque
