Ouvrir le menu principal

iGeneration

Recherche

Apple et Carnegie Mellon cherchent à rendre les assistants conscients de leur environnement

Florian Innocente

jeudi 23 avril 2020 à 17:02 • 8

Domotique

Une petite équipe d'Apple et de l'Université de Carnegie Mellon au États-Unis a publié ses travaux sur un système baptisé "Listen Learner". Il vise à rendre les assistants électroniques capables de comprendre la nature des sons qui les entourent et d'exécuter des actions en conséquence.

Il y a deux ans, avant de rejoindre Apple, l'un de ces chercheurs, Gierad Laput, avait travaillé sur ce mécanisme et proposé quelques exemples pratiques. Dans un atelier, le téléphone de l'opérateur pourrait afficher une consigne de sécurité — comme d'enjoindre de mettre ses lunettes de sécurité — lorsqu'il reconnaît le bruit d'une machine-outil qui est mise en marche.

Dans la cuisine, l'assistant pourrait caler l'énoncé des étapes d'une recette, simplement en repérant qu'une tâche entamée a été terminée (bruit de couteau, bruit de mixer…).

Pour une personne malentendante, le bruit du micro-onde ou de quelqu'un frappant à la porte provoquerait l'envoi d'une notification vers son téléphone.

Au poignet, la captation par votre montre d'une toux récurrente pourrait offrir une information sur votre état de santé. De la même manière que l'analyse d'un mouvement effectué par les capteurs de la montre, associé au bruit provoqué (frapper contre une porte, scier) pourrait participer à améliorer la compréhension future par le système de l'action en cours.

Car le principal challenge consiste justement à identifier ces bruits pour les ranger dans un dictionnaire de sons. Une première méthode consiste à demander à l'utilisateur de répéter une action (comme d'ouvrir une porte) pour entrainer l'oreille du Listen Learner et affecter ensuite un nom. Cela peut donner des résultats précis mais c'est laborieux. Autre approche : l'appareil contenant l'assistant est programmé par défaut avec une large base de sons pré-identifié. Mais il y a le risque que ce ne soit pas assez précis par rapport aux bruits de votre environnement.

La troisième voie consiste à laisser le système apprendre tout seul à repérer des sons caractéristiques, qui se manifestent régulièrement. Avec l'avantage que dans une pièce donnée, il y a tout lieu de penser qu'ils seront en nombre réduit et récurrents.

Lorsqu'un schéma sonore caractéristique commence à se construire, un "cluster" va se former. Lorsqu'il atteint une certaine taille, l'assistant demandera à l'utilisateur de lui donner un nom pour ce profil de bruit qu'il n'a cessé d'entendre.

Pour éviter de sans cesse interpeller l'utilisateur, l'assistant pourrait avoir quelques modèles sonores type préenregistrés et demander plutôt si le bruit en question correspond bien à telle chose, auquel cas on ne répondra que par oui ou non.

Si le système hésite sur un son pouvant appartenir à deux clusters déjà identifié — mettons le bruit d'un sèche-cheveux qui ressemblerait à celui d'un aspirateur — il demandera à l'utilisateur lequel est le bon. Autant de contributions ponctuelles qui viendront renforcer ces clusters de sons.

Plusieurs choses restent sujettes à des difficultés techniques, admettent les chercheurs. La question de la confidentialité des données captées en est une, la puissance nécessaire au traitement en direct de ces infos en est une autre — cela pouvant être fait la nuit lorsque l'assistant est inoccupé — sans oublier la capacité à isoler et identifier un son au milieu de plusieurs.

Source :

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Des iPhone 17 uniquement eSIM en France ? Les opérateurs sont fin prêts

16:10

• 6


France Identité : l’intégration de la carte grise disponible en bêta

14:25

• 52


Grosse panne sur les réseaux mobile et fixe de SFR

13:44

• 32


Un Steam Deck caché dans un clavier Apple pour l'utiliser avec des lunettes AR

13:00

• 8


iOS 26 va faciliter le transfert d’eSIM avec les smartphones Android

12:30

• 4


iOS 26 peut réserver de l’espace de stockage pour les mises à jour automatiques

11:04

• 9


iOS 26 : les pochettes animées sur l’écran de verrouillage fonctionneront sur les services tiers

10:04

• 11


Découverte de Messages dans iOS 26 : sondages, traduction, interface…

15/06/2025 à 10:00

• 38


Sortie de veille : une WWDC 2025 réussie ? Notre débrief d’iOS 26, Liquid Glass…

14/06/2025 à 12:50

• 11


iOS 26 : une nouvelle bêta 1 pour les développeurs

13/06/2025 à 20:45

• 60


Microsoft trolle Apple sur Liquid Glass, mais attention au retour de manivelle

13/06/2025 à 20:30

• 53


SAV : l'iPhone XS qui avait lancé l'eSIM chez Apple devient un produit en fin de vie

13/06/2025 à 16:51

• 34


HomePod et Apple TV devraient être compatibles Thread 1.4 avec tvOS 26

13/06/2025 à 16:38

• 7


Crazy Taxi, Sonic CD, Golden Axe et de nombreux jeux SEGA deviennent gratuits parce que le développement est abandonné

13/06/2025 à 16:00

• 20


Les usines indiennes ont exporté à fond vers les États-Unis pendant la crise douanière avec la Chine

13/06/2025 à 15:45

• 2


Not Boring Camera : comme Halide, mais en plus fun

13/06/2025 à 15:30

• 8