Un développeur, Mate Marschalko, a montré une expérience intéressante récemment sur Medium : il a utilisé ChatGPT pour construire l'équivalent des assistants vocaux comme Siri, Alexa ou Google Assistant1.
Une maison HomeKit gérée par ChatGPT
Il explique qu'il dispose d'un logement entièrement domotisé avec des appareils HomeKit, et il a donc utilisé les outils Apple pour remplacer Siri. La première étape a été d'apprendre à ChatGPT comment fonctionne HomeKit, avec un long texte qui présente les bases des commandes et indique qu'il faut générer du JSON, un format de données structuré, employé en JavaScript.
Des commandes bien plus complexes
Le point intéressant de ce choix n'est pas que ChatGPT arrive à générer le code nécessaire pour activer les différents éléments — ce qui est déjà un exploit — mais que la technologie permet de faire des phrases nettement plus compliquées qu'avec les assistants classiques.
Siri et les autres demandent des phrases simples, standardisées et parfois absconses. Typiquement, il faut par exemple dire « Dis Siri, allume la lumière dans le bureau ». Et pas uniquement « Allume dans le bureau », ce qui risque d'activer des prises connectées dans certains cas. Dans un de ces exemples, l'auteur explique qu'il a utilisé la phrase « Je viens de remarquer que j'enregistre cette vidéo dans le noir au bureau. Peux-tu faire quelque chose à ce sujet ? ». Elle est compliquée, ambiguë, et si vous tentez avec Siri, ça ne fonctionne pas2.
Il donne quelques autres exemples dans son article, mais l'idée est là : ChatGPT comprend mieux que Siri et peut contrôler la maison connectée facilement.
Intégrer le tout dans les raccourcis
Nous n'allons pas vous détailler la méthode exacte, vous pouvez aller lire l'article et le raccourci a été partagé. Mais l'idée est de coupler les raccourcis des OS Apple avec les API d'OpenAI, la société à l'origine de ChatGPT. Pour ce cas de figure, l'accès est payant mais le prix demeure assez faible : 0,014 $ par requête, soit à peu près 70 demandes pour 1 $.
Le raccourci lui-même mériterait une couche de polish sur la logique qui lie les réponses aux commandes, mais l'auteur en est parfaitement conscient. De même, il faut adapter le texte de départ à votre logement, en fonction de vos équipements. Mais dans les faits, et la vidéo vue plus haut le montre bien, son assistant conçu de bric et de broc fonctionne mieux sur pas mal de points que Siri, par exemple. Ce qui explique que Google travaille sur ce genre de technologies.