Rabbit R1 : un lapin dans la main nourri à l'IA

Florian Innocente |

Avec son faux air de jouet, le Rabbit R1 veut simplifier l'utilisation quotidienne des services en lignes avec le concours de l'intelligence artificielle. En ligne de mire, les smartphones devenus trop touffus.

Les smartphones et les enceintes connectées vont-ils se faire marcher sur les pieds par une nouvelle génération de petits appareils spécialisés mus par l'intelligence artificielle ? En tout cas, de petits coups de boutoir sont régulièrement donnés depuis que sont apparus ChatGPT et ses cousins. Il y a eu récemment l'IA Pin conçu par d'anciens d'Apple et il y aura peut-être demain un produit signé conjointement par Jony Ive et Sam Altman.

Jesse Lyu, CEO de Rabbit, tenant le R1.

Aujourd'hui, entre les deux, il y a le R1 développé à Los Angeles par la startup Rabbit. Cet appareil, tout de rouge vêtu, contient un écran tactile de 2,88 pouces ; une caméra rotative ; un bouton latéral pour actionner la reconnaissance vocale avec un assistant à tête de lapin ; une molette physique pour naviguer dans l'interface ainsi que des micros et haut-parleurs. Pour l'électronique, ses créateurs ont mis un processeur MediaTek de 2,3 GHz, 4 Go de RAM, 128 Go de stockage, un modem 4G, du Bluetooth et du Wi-Fi. L'autonomie serait d'une journée, sans plus de détails. L'objet, dessiné par Teenage Engineering dont l'esprit à la fois ludique et tranché se retrouve dans ce design, pourrait être un cousin de la Play.date de Panic. Son prix : 199 $ seulement (184,95 €) et pas d'abonnement.

Le credo de Rabbit est que les smartphones sont devenus des armoires remplies d'apps, fastidieuses et nombreuses à utiliser pour conduire des tâches routinières et que les assistants sur les enceintes connectées sont, pour résumer, assez idiots. Même s'il s'agit de dézinguer la concurrence pour mieux mettre en valeur son produit, le propos de Jesse Lyu, CEO de la startup, n'est pas totalement dénué de vérité.

Pas d'apps pour ceci ou cela sur le R1, RabbitOS utilise de grands modèles de langage pour effectuer des actions complexes sur ordre (vocal) de l'utilisateur. On peut aussi afficher un clavier virtuel en secouant l'objet, mais ce n'est pas le mode d'interaction privilégié puisqu'un appui sur un bouton est nécessaire pour que le lapin vous écoute.

L'astuce derrière le R1 est de ne pas avoir besoin d'apps développées expressément pour lui. Il ne dépend pas du bon vouloir des éditeurs pour remplir une énième boutique d'apps. Le fonctionnement repose sur la connexion aux services existants et sur l'apprentissage et la répétition.

Le Rabbit Hole est le nom d'un portail utilisateur que l'on utilise, sur le web depuis son ordinateur, pour configurer préalablement le RabbitOS de son R1. À travers ce "terrier de lapin", on se connecte à Spotify, à Uber, au site de Pizza Hut, etc., en utilisant l'écran de connexion standard de ces services. On n'a pas besoin d'un compte fourni par Rabbit pour servir d'interface.

Ensuite, lorsque ces sites sont reliés à son R1, pour lancer de la musique, demander des infos sur un chanteur, commander une pizza particulière ou faire venir un taxi, c'est l'assistant intelligent — le "ChatGPT" du système du R1, qui se débrouille avec ses neurones entrainés sur des modèles de langage. Jesse Lyu montre à un moment le traitement d'une requête assez complexe pour exécuter une succession de réservations de vol, d'hôtel et de voiture. L'assistant se débrouille et propose ses trouvailles à la validation de l'utilisateur. Les contenus reçus sont remis en forme pour l'écran du R1, on ne tombe pas sur des pages web.

L'écran est aussi là pour confirmer l'exactitude de la compréhension des requêtes et échanger avec l'utilisateur lorsqu'il faut passer en revue des propositions avant d'en valider une. L'interface paraît assez dépouillée et parfois même amusante avec sa mascotte de lapin stylisé.

Pour d'autres tâches, c'est la caméra qui est utilisée. En filmant une feuille Excel sur l'écran d'un ordinateur, on demande un coup de main au lapin pour y apporter des modifications. Ou alors, on lui montre le contenu d'un frigo — car, comme dans la démo, son contenu chez vous est aussi rangé et organisé que des œuvres accrochées dans un musée — et une suggestion de recette apparaît.

Puis il y a le principe de l'apprentissage pour des actions répétitives. L'exemple utilisé est celui de la génération d'une image avec Midjourney. On se connecte au service au travers du Rabbit Hole sur son ordinateur et on instruit le système du R1 sur la façon de réaliser certaines tâches (choisir un thème d'image, préciser ses caractéristiques et demander son rendu). On pourra ensuite répéter l'opération directement depuis le R1 puisque son système aura appris les étapes nécessaires et il se contentera de les répéter. Cela devrait surtout marcher avec des opérations ayant un caractère répétitif.

En conclusion de sa démonstration — convaincante à certains égards — Jesse Lyu dit ne pas chercher à remplacer les smartphones, mais on sent que la tentation est grande. La valeur du R1 tiendrait dans le fait qu'aucun smartphone actuel ne sait proposer les mêmes services et le faire aussi vite et simplement. Mais combien de temps faudra-t-il à Google, Apple ou Samsung pour ajouter cette corde à leur arc. Et faire de ces appareils supplémentaires des objets superflus et encombrants ?

Avec ce prix plutôt serré, Rabbit a déjà prévendu 10 000 exemplaires de son R1 en 24h. Ils seront livrés entre mars et avril. Un second lot de 10 000 unités n'a pas fait long feu non plus et un troisième est en préparation. Les commandes depuis la France sont acceptées, mais sans date de livraison pour le moment. Par ailleurs la startup a réussi une levée de fonds de 20 millions de dollars.

avatar ys320 | 

Ca promet d’être un beau jouet😂

avatar Lonsparks23 | 

Force de constater qu’ils ont réussi à faire parler d’eux !

Beaucoup d’avis viscéraux dans les deux sens. Pour certain c’est une petite révolution du smartphone et pour d’autres c’est juste un pseudo Tamagoshi LLM connecté à des API (et soumis au bien vouloir des entreprises qui les proposent).

Perso je suis entre les deux, ça me fait penser à la vibes Rapsberry au début : un petit objet pour la bidouille un peu hype et surtout très peu cher qui va se vendre à la pelle.

Et force de constater que TE a fait un beau boulot de design comme à leur habitude.

J’étais à deux doigts de la précommande par curiosité et pour tester mais on verra. Cette année on attend sûrement Bard sur Pixel et SiriA qui pourraient proposer des choses équivalentes directement dans un appareil qu’on a déjà sur nous et qu’on charge déjà tous les jours.

avatar roms.nc | 

@Lonsparks23

A ma grande époque kickstarter, j’aurais pre commandé direct..

Mais ça c’était avant.

Ça aurait fini dans un placard.

avatar fleeBubl | 

@Lonsparks23

Imagine : le p’tit écran d’un vieux serveur perdu au fond d’un bureau abandonné, derrière une autre porte d’un espace de d’ordinateurs de table avec toutes ces chaises vides. À priori, rien ne se passe sur l’écran. Pas de clavier, pas de souris, aucune interface pour interagir avec. Mais en y regardant de plus près : un bouton à l’écran avec un pointeur discret positionné dessus. Et Juste un bref clignotement étrange.

un click !

C’est juste le déclic qu’il faut pour concevoir leur AI :

leur Interface d’Actions

avatar adrien1987 | 

J'ai besoin de ça !!

avatar Floriendive | 

On peut décidément toujours compter sur Teenage Engineering pour proposer des designs léchés et mignons !
Merci pr l'article de qualité 🙌🏽

avatar fousfous | 

Ça a l'air bien pour envoyer des messages et aller sur le web...
Blague à part, une interface c'est quand même plus pratique que de vouloir tout faire a la voix (je me rappelle pas de tous les titres de mes albums par exemple, c'est bien mieux de regarder les pochettes).

avatar Insomnia | 

@fousfous

Sauf I il va falloir y passer un jour ou l’autre. Cela reste déjà super pratique pour les personnes en situation de handicape. Et son prix n’est pas un frein pour une fois. Je me tenterais à tester.

avatar fousfous | 

@Insomnia

Pourquoi "il faudra y passer un jour"?
Pour les personnes en situation de handicap OK, mais je ne vois pas être utilisé massivement par les gens.

avatar Insomnia | 

@fousfous

Parce que cela existe déjà dans certains pays et que l’homme est si fainéant qu’il ira facilement sur cette utilisation, mais cela reste mon propre avis 🤪

avatar iPop | 

@fousfous

« je me rappelle pas de tous les titres de mes albums par exemple, c'est bien mieux de regarder les pochettes »

Sans oublier la traduction franglais des titres qu’il faut apprendre.

avatar athao | 

Et l’autonomie ? 😂🥰

avatar occam | 

Le Journal du Rabbit ?
Le Journal du IA Pin ?

avatar powergeek | 

Je vous conseille l'interview de Sam Altman par Bill Gates si vous voulez avoir un aperçu du futur...

avatar iPop | 

@powergeek

Un aperçu ? De Bill Gate ? 🤮non merci.

avatar powergeek | 

@iPop

Encore un qui est resté bloqué en 1997 🙄

avatar serenity | 

@powergeek

On parle bien de Bill Gates, pote avec Epstein le trafiquant sexuel de mineures, en proie lui-même à des plaintes pour harcèlement, et qui a une fondation qui investit dans le pétrole, l’armement et les boissons gazeuses. La version 1997 était bien plus édulcorée.

avatar powergeek | 

@serenity

Le plus important c’est ce que dit Sam Altman.

avatar melaure | 

Mouais … pas convaincu … je me prendrais plutôt un emopet, au moins les interactions sont amusantes …

avatar guigus31 | 

La dernière fois que j’ai été aussi emballé par un « device », c’était en 2010 à la sortie de l’iPhone 4. Je parle du design mais aussi des fonctions proposées. J’ai de nouveau l’impression d’être face à un objet « du futur », ça ne m’était plus arrivé depuis !

Après, effectivement, fort à parier que dans 9 mois c’est intégré à l’iPhone.
Vivement, car j’en ai raz le bol de toutes ces applis connes comme leurs pieds.

avatar DrJonesTHX | 

En gros, y’a plus qu’à rajouter la fonction téléphone….

avatar serenity | 

@DrJonesTHX

Et à agrandir un peu l’écran, ajouter de la couleur, améliorer les capteurs photo.

avatar hugome | 

J’ai bossé il y a 15 ans sur des concepts d’interface audio. C’est quand même pas facile du tout de faire un truc intuitif.
Y a qu’à voir comment Apple rame avec Siri

avatar AKZ | 

C ‘est un gadget probablement sans avenir. On sait bien que nos smartphones vont intégrer ce genre de fonctionnalités.

avatar mp_ | 

Je ne comprends même pas pourquoi ce n’est pas Pierre qui a écrit cette news 😁

avatar vincentn | 

On reconnaît bien la patte de TE dans le design, assez sympa.

Mais quel est le modèle économique ?

Il s’agit d’un appareil qui nécessite obligatoirement une connexion réseau, où l’on doit interconnecter ses comptes et données avec un intermédiaire et ses serveurs qui va mouliner ses algos sur d’autres algos sans qu’on ait réellement d’informations et de transparence sur cette partie.

C’est certes « Kawai », sans abo, pas très cher mais où est le loup ?

avatar guigus31 | 

@vincentn

« sans qu’on ait réellement d’informations et de transparence »

Je pense que c’est justement ça, le loup : la revente de données.

Ou alors, comme tous les services, une fois les utilisateurs suffisamment captifs, mise en place d’un abonnement, échelonné avec des options forcément indispensables

avatar Gxf | 

Il faut quand même souscrire à un abonnement 4G, ou à une extension de forfait avec une SIM supplémentaire si on ne veut pas l'utiliser pour téléphoner. Il y a un cout mensuel en plus de l'achat de l'appareil.
Ma première réaction a quand même été "ce serait mieux si c'était intégré à mon smartphone, car je ne vais trimballer/charger un appareil en plus". Je ne vois rien qu'on ne devrait pas pouvoir faire sur un smartphone. Je trouve même étonnant qu'ils aient pris le parti de fabriquer du hardware au lieu de proposer une App sur les différents store.
Mais je peux me tromper, et ce type d'appareil, une fois raffiné, pourrait aussi bien trouver son public.
A court terme, je creuserais volontiers l'aspect "privacy", quelles données consent-on à leur donner pour réussir à traiter les requêtes mais aussi à entrainer leurs modèles.

avatar l3chvck | 

@Gxf

Je pense que leur objectif c’est de faire parler d’eux avec ce bidule inutile, pour ensuite etre rachetés par Apple Google ou Samsung. Une simple app n’aurait eu aucun relai médiatique. C’est probablement le business plan, car ce machin électronique (un de plus) n’a aucun avenir.

avatar gillesb14 | 

@l3chvck

« Ce truc ne marchera Jamais! »
Steve Ballmer 2007.
😂

avatar Dziga_Vertox | 

C’est bien compliqué pour un truc supposé simplifier les choses.

L’argument du : le smartphone est trop compliqué créons un.e nouvel.le objet / interface est un argument totalement bidon et bidonnant. Attrape gogo.

avatar shaba | 

Je pense que les futures versions de Siri ou Google assistant feront la même chose sans avoir à se trimballer un appareil supplémentaire.

avatar tigerwoke | 

Commandé sur la première vague des 10000
Je Posterai un rex

avatar TiTwo102 | 

J’dois être vieux jeu, mais en fait, ce genre de d’innovation me fait plus chier qu’autre chose.

Quand je veux commander une pizza, j’ouvre l’appli et en 2 sec je vois celle qui me plait. J’ai pas à attendre qu’un voix robotique me les décrivent une par une jusqu’à la dernière pour faire mon choix, alors que j’aurais déjà oublié la première quand il en sera à la dernière. D’ailleurs, qui commande une pizza en disant « je vais prendre la plus populaire, peu importe laquelle… » ? L’exemple est tellement éclaté qu’il ont été obligé de trouver ce tour de passe passe ridicule.

Quand je veux voir mon calendrier, je déverrouille, le widget est juste là, 2 sec après j’ai vu ce que je voulais voir et basta. J’ai pas envie d’un dialogue de 30 secondes avec un lapin. Encore moins quand j’suis dans mon canapé devant un film, ou dans un endroit avec des gens autour.

Bref, peut-être que le futur me fera mentir, mais le visuel reste pour moi bien supérieur à l’auditif (si on peut dire ça comme ça).

avatar l3chvck | 

Au lieu de faire encore un bidule électronique qui va consommer ressources et polluer (parce qu’on imagine qu’ils vont en sortir un nouveau chaque année), une app pourrait faire exactement la même chose. Parce que s’ils croient que ca va remplacer le smartphone ils se foutent le doigt dans l’oeil bien profond.

avatar Lestat1886 | 

Ça peut éventuellement être sympa pour une forme de digital detox mais bon c’est quand même un gadget bien redondant et moins complet que l’existant et donc à mon avis globalement inutile.

Et il n’y a pas besoin de temps pour que Google Apple et les autres proposent un appareil équivalent si ce n’est renforcer leur assistant, ce qui est imminent. Cet appareil n’apporte rien de plus qu’une smartwatch avec un assistant plus intelligent!

CONNEXION UTILISATEUR