Figure AI progresse dans la robotique pour la maison avec son modèle Helix

Avec son modèle vision-langage-action Helix, Figure AI démontre que ses robots peuvent directement être contrôlés à partir d'instructions en langage naturel. Contrairement aux systèmes robotiques précédents, Helix peut traiter des manipulations à long terme, collaboratives et habiles à la volée, sans avoir été entraîné  cela auparavant. Une prouesse qui pourrait amener les robots humanoïdes à investir les foyers.

Partager
Figure AI progresse dans la robotique pour la maison avec son modèle Helix
En envoyant des commandes textuelles au robot, ce dernier peut ramasser pratiquement n'importe quel objet.

Le fabricant américain de robots humanoïdes Figure avance ses pions. Son dernier modèle d'IA de type "vision-langage-action" (VLA) baptisé Helix permet aux robots de comprendre les commandes vocales et de manipuler des objets qu'ils n'ont jamais vus auparavant. L'intégration de ce modèle offre notamment un contrôle continu de l'ensemble du haut du corps humanoïde, y compris les poignets, le torse, la tête et les doigts individuels.

De même, il est capable de fonctionner simultanément sur deux robots, leur permettant de résoudre une tâche de manipulation partagée, même avec des éléments qu'ils n'ont jamais vus auparavant, simplement en suivant des instructions en langage naturel.

Deux systèmes réunis en un seul

Pour parvenir à cela, Helix utilise un seul ensemble de poids de réseau neuronal pour apprendre tous les comportements (sélection et placement d'articles, utilisation de tiroirs et de réfrigérateurs et interaction entre robots) sans aucun fine-tuning spécifique à la tâche. Le système combine un "cerveau" de 7B paramètres pour la compréhension et un modèle rapide de 80M paramètres pour le contrôle précis des mouvements.

Ainsi, plutôt que d'apprendre aux robots ne serait-ce qu’un seul nouveau comportement, Figure AI veut faire évoluer l'apprentissage de ces robots grâce à des modèles d'IA comme Helix qui embarque deux systèmes : un VLM embarqué pré-entraîné sur Internet fonctionnant à 7-9 Hz pour la compréhension de la scène et la compréhension du langage appelé S1 et une politique visuomotrice réactive rapide qui traduit les représentations sémantiques latentes produites en actions robotiques continues précises à 200 Hz appelé S2.

Un modèle capable de tourner sur des GPU embarqués

"Cette architecture découplée permet à chaque système de fonctionner à son échelle de temps optimale. S2 peut « penser lentement » à des objectifs de haut niveau, tandis que S1 peut « penser vite » pour exécuter et ajuster des actions en temps réel", assure la start-up.

Autre point important : Helix fonctionne entièrement sur des GPU embarqués à faible consommation d'énergie et ne nécessite que 500 heures d'entraînement, ce qui en fait un atout de taille pour son déploiement commercial.

Un changement de stratégie qui pourrait s'avérer payant

Figure AI a publié plusieurs vidéos de démonstration où l'on voit deux robots ranger des courses après avoir reçu des commandes à l'oral de la part d'une personne. L'objectif pour la start-up est de déployer ses robots à usage général aussi bien en entreprise qu'à domicile.

Cette avancée montre sa confiance dans le marché de la robotique pour la maison. "Pour que les robots soient utiles dans les foyers, ils devront être capables de générer de nouveaux comportements intelligents à la demande, en particulier pour des objets qu'ils n'ont jamais vus auparavant, assure l'entreprise. L’état actuel de la robotique ne pourra pas s’appliquer à la maison sans un changement radical".

SUR LE MÊME SUJET

Sujets associés

NEWSLETTER L'Usine Digitale

Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.

Votre demande d’inscription a bien été prise en compte.

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes...

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes du : Groupe Moniteur Nanterre B 403 080 823, IPD Nanterre 490 727 633, Groupe Industrie Service Info (GISI) Nanterre 442 233 417. Cette société ou toutes sociétés du Groupe Infopro Digital pourront l'utiliser afin de vous proposer pour leur compte ou celui de leurs clients, des produits et/ou services utiles à vos activités professionnelles. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.

CHERCHE TALENTS NUMERIQUE

Les formations USINE DIGITALE

Toutes les formations

ARTICLES LES PLUS LUS