Lors de la conférence SpeechTEK 2010, Microsoft a fait la démonstration des fonctions de reconnaissance vocale de Windows Phone 7. Pour Zig Serafin, en charge de ce projet, « la reconnaissance vocale n'est pas une application séparée [mais] plutôt partie intégrante de l'expérience utilisateur ».
Il a commencé par fustiger l'approche de Google et d'Apple, qui utilisent les icônes comme élément principal d'interface : « la plupart des smartphones utilisent des grilles d'icônes, comme Windows 3.1 ». Il est vrai que Windows Phone 7 s'éloigne de cette métaphore au profit d'une interface assumant clairement le numérique, ne cherchant pas à imiter le réel, mais utilisant la typographie comme structure principale (lire : Interface iPad : Apple se trompe-t-elle ?).
« Quand vous passez à un appareil qui n'a pas un grand clavier, la voix est un complément attrayant », explique-t-il, reprenant et développant l'idée fixe de Bill Gates sur le couple tactile/voix, à l'époque pour les TabletPCs. La reconnaissance vocale est ainsi partie prenante des NUI, les natural user interfaces ou « interfaces utilisateurs naturelles ». Si sur Windows Phone 7, ces NUI sont le tactile et la voix, c'est plutôt l'utilisation de gestes captés par un module Kinect en plus de la voix qui pourront permettre à l'utilisateur d'interagir avec sa XBox, par exemple.
Le directeur marketing de Microsoft Ilya Bukshsteyn a fait la démonstration de quelques commandes vocales : alors que la reconnaissance vocale d'iOS se limite à l'appel et au pilotage de la musique et que celle d'Android est principalement utilisée pour la recherche, celle de Windows Phone 7 veut couvrir tous les aspects du système, le but étant, à terme, de pouvoir piloter toute l'interface à la voix avec du langage naturel.
Bukshsteyn a commencé par une fonction classique, l'appel, pour démontrer les fonctions interactives de ce système : en demandant d'appeler « Paul », le téléphone lui a répondu qu'il connaissait plusieurs « Paul ». Il a alors donné la liste, et Bukshsteyn a pu répondre en donnant le bon nom de famille.
Bukshsteyn a ensuite montré le pilotage de l'interface, lançant l'application Photos par la voix. Enfin, il a montré l'intégration de la reconnaissance vocale au moteur décisionnel Bing : il a demandé un restaurant chinois, et le téléphone a lancé l'interface de recherche locale, affichant les restaurants chinois autour de Bukshsteyn.
Microsoft a acquis les technologies de Tellme Networks en 2007 pour développer cette fonction. Les services de Tellme sont les services les plus utilisés aujourd'hui, notamment dans le domaine des serveurs vocaux, où ils sont utilisés pour répondre à 2,5 milliards d'appels. Dans un premier temps, la reconnaissance vocale se limitera à la recherche, l'appel, et la navigation dans les photos, et sera augmentée au fur et à mesure.
Une partie de la reconnaissance sera faite par le téléphone, qui utilisera certainement un processeur spécifique comme le fait l'iPhone, et une partie sera faite sur les serveurs de Tellme, à la manière de la reconnaissance vocale de Google.
MacGeneration a besoin de vous
Vous pouvez nous aider en vous abonnant ou en nous laissant un pourboire
Soutenez MacGeneration sur Tipeee
La charge rapide a un effet limité sur la santé des batteries de nos smartphones, la preuve
08:30
• 1
iPhone : Apple veut pousser la connexion satellite beaucoup plus loin
06:52
• 7
L’avenir du satellite, le retour du MacBook et le contrat à un milliard de dollars : la semaine Apple
09/11/2025 à 21:06
• 15
WhatsApp sur le point de s’ouvrir aux messageries tierces
09/11/2025 à 15:18
• 60
Test du lampadaire de SwitchBot : un bon éclairage Matter sans se ruiner
08/11/2025 à 23:00
• 51
Sortie de veille : un nouveau MacBook autour de 700 €, trop beau pour être vrai ?
08/11/2025 à 10:54
• 28
L’arrivée d’Apple comme diffuseur a eu l’effet d’une bombe, et la F1 compte bien exploiter le partenariat au maximum
07/11/2025 à 21:00
• 50
Apple a complété les bêtas publiques : iOS, iPadOS, macOS, tvOS et watchOS 26.2 tous disponibles
07/11/2025 à 20:15
• 7
Netflix veut proposer des publicités interactives pour son abonnement le moins cher
07/11/2025 à 19:20
• 27
Starlink offre une connexion satellitaire à davantage d’Apple Watch
07/11/2025 à 19:00
• 19
iPhone 18 : vers une caméra frontale plus discrète et 24 mégapixels ?
07/11/2025 à 16:09
• 9
Amazon va bloquer les apps d'IPTV sur les Fire TV Stick, même ceux sous Android
07/11/2025 à 15:25
• 23
Vibes : Meta lance son équivalent à Sora en Europe
07/11/2025 à 15:02
• 14
Free Mobile a le plus gros réseau 3G de France… et va l'abandonner
07/11/2025 à 13:10
• 57
Ring Intercom : l’interphone connecté d’Amazon passe à la vidéo
07/11/2025 à 11:21
• 1
Android pense que les AirPods Pro 3 vous traquent… et c'est vrai
07/11/2025 à 11:07
• 11

Test du lampadaire de SwitchBot : un bon éclairage Matter sans se ruiner

Test du Fire TV Stick 4K Select sous Vega OS : l'abandon d'Android n'amène que des défauts

Test du câble de charge Kuxiu M30 : enfin un équivalent au MagSafe sur iPad grâce au Smart Connector

Test des iPad Pro M5 : toujours plus forts, pas vraiment plus pros

Test du POP Phone de Native Union : un combiné téléphonique USB-C drôlement branché






