Ouvrir le menu principal

iGeneration

Recherche

Apple et Carnegie Mellon cherchent à rendre les assistants conscients de leur environnement

Florian Innocente

jeudi 23 avril 2020 à 17:02 • 8

Domotique

Une petite équipe d'Apple et de l'Université de Carnegie Mellon au États-Unis a publié ses travaux sur un système baptisé "Listen Learner". Il vise à rendre les assistants électroniques capables de comprendre la nature des sons qui les entourent et d'exécuter des actions en conséquence.

Il y a deux ans, avant de rejoindre Apple, l'un de ces chercheurs, Gierad Laput, avait travaillé sur ce mécanisme et proposé quelques exemples pratiques. Dans un atelier, le téléphone de l'opérateur pourrait afficher une consigne de sécurité — comme d'enjoindre de mettre ses lunettes de sécurité — lorsqu'il reconnaît le bruit d'une machine-outil qui est mise en marche.

Dans la cuisine, l'assistant pourrait caler l'énoncé des étapes d'une recette, simplement en repérant qu'une tâche entamée a été terminée (bruit de couteau, bruit de mixer…).

Pour une personne malentendante, le bruit du micro-onde ou de quelqu'un frappant à la porte provoquerait l'envoi d'une notification vers son téléphone.

Au poignet, la captation par votre montre d'une toux récurrente pourrait offrir une information sur votre état de santé. De la même manière que l'analyse d'un mouvement effectué par les capteurs de la montre, associé au bruit provoqué (frapper contre une porte, scier) pourrait participer à améliorer la compréhension future par le système de l'action en cours.

Car le principal challenge consiste justement à identifier ces bruits pour les ranger dans un dictionnaire de sons. Une première méthode consiste à demander à l'utilisateur de répéter une action (comme d'ouvrir une porte) pour entrainer l'oreille du Listen Learner et affecter ensuite un nom. Cela peut donner des résultats précis mais c'est laborieux. Autre approche : l'appareil contenant l'assistant est programmé par défaut avec une large base de sons pré-identifié. Mais il y a le risque que ce ne soit pas assez précis par rapport aux bruits de votre environnement.

La troisième voie consiste à laisser le système apprendre tout seul à repérer des sons caractéristiques, qui se manifestent régulièrement. Avec l'avantage que dans une pièce donnée, il y a tout lieu de penser qu'ils seront en nombre réduit et récurrents.

Lorsqu'un schéma sonore caractéristique commence à se construire, un "cluster" va se former. Lorsqu'il atteint une certaine taille, l'assistant demandera à l'utilisateur de lui donner un nom pour ce profil de bruit qu'il n'a cessé d'entendre.

Pour éviter de sans cesse interpeller l'utilisateur, l'assistant pourrait avoir quelques modèles sonores type préenregistrés et demander plutôt si le bruit en question correspond bien à telle chose, auquel cas on ne répondra que par oui ou non.

Si le système hésite sur un son pouvant appartenir à deux clusters déjà identifié — mettons le bruit d'un sèche-cheveux qui ressemblerait à celui d'un aspirateur — il demandera à l'utilisateur lequel est le bon. Autant de contributions ponctuelles qui viendront renforcer ces clusters de sons.

Plusieurs choses restent sujettes à des difficultés techniques, admettent les chercheurs. La question de la confidentialité des données captées en est une, la puissance nécessaire au traitement en direct de ces infos en est une autre — cela pouvant être fait la nuit lorsque l'assistant est inoccupé — sans oublier la capacité à isoler et identifier un son au milieu de plusieurs.

Source :

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Spotify, Match et d’autres se liguent (encore) contre Apple et Google

12:30

• 0


Apple mord la poussière face à Epic, mais ne rend pas les armes

09:56

• 39


Nos trucs et astuces pour mieux utiliser Apple Pay sur votre iPhone

08:54

• 19


Pourquoi Telegram et Signal menacent de quitter la France, voire l’Union européenne

30/04/2025 à 22:00

• 97


Le CEO de Google confirme discuter avec Apple pour intégrer Gemini à Siri d’ici la fin de l’année

30/04/2025 à 21:30

• 27


Apple ne propose plus de nouvelle couleur au printemps, et les (Product)RED semblent définitivement enterrés

30/04/2025 à 21:00

• 17


OpenAI enlève GPT-4, et supprime le côté flatteur de l’IA pour la rendre plus efficace et économiser des millions de dollars

30/04/2025 à 20:15

• 14


La puce de la Nintendo Switch 2 est plus grosse qu'une puce M4… parce que Nintendo emploie de vieilles technologies

30/04/2025 à 18:15

• 34


Promo : des batteries magnétiques Anker et Ugreen à partir de 36 €

30/04/2025 à 17:52

• 17


Carrefour propose 15 % de réduction sur des produits Apple (comme les AirPods Max) si vous avez la carte de fidélité

30/04/2025 à 16:49

• 27


De nombreuses failles corrigées dans AirPlay et CarPlay, des piliers de la stratégie d'Apple

30/04/2025 à 16:10

• 11


Raycast arrive sur l’iPhone, essentiellement pour les fonctions liées à l’IA

30/04/2025 à 13:53

• 3


French Days : l'iPhone 13 à 599 € avec 512 Go

30/04/2025 à 11:29

• 20


B&You ajoute des frais de résiliation sur tous ses forfaits

30/04/2025 à 10:55

• 63


LG plante le dernier clou sur le cercueil de ses smartphones en fermant les serveurs de mises à jour

30/04/2025 à 10:33

• 5


Promo : l'Apple Watch Series 9 45 mm à 269 €, soit moins cher qu'une Apple Watch SE !

30/04/2025 à 09:00

• 14