Figure AI progresse dans la robotique pour la maison avec son modèle Helix
Avec son modèle vision-langage-action Helix, Figure AI démontre que ses robots peuvent directement être contrôlés à partir d'instructions en langage naturel. Contrairement aux systèmes robotiques précédents, Helix peut traiter des manipulations à long terme, collaboratives et habiles à la volée, sans avoir été entraîné cela auparavant. Une prouesse qui pourrait amener les robots humanoïdes à investir les foyers.
Le fabricant américain de robots humanoïdes Figure avance ses pions. Son dernier modèle d'IA de type "vision-langage-action" (VLA) baptisé Helix permet aux robots de comprendre les commandes vocales et de manipuler des objets qu'ils n'ont jamais vus auparavant. L'intégration de ce modèle offre notamment un contrôle continu de l'ensemble du haut du corps humanoïde, y compris les poignets, le torse, la tête et les doigts individuels.
De même, il est capable de fonctionner simultanément sur deux robots, leur permettant de résoudre une tâche de manipulation partagée, même avec des éléments qu'ils n'ont jamais vus auparavant, simplement en suivant des instructions en langage naturel.
Deux systèmes réunis en un seul
Pour parvenir à cela, Helix utilise un seul ensemble de poids de réseau neuronal pour apprendre tous les comportements (sélection et placement d'articles, utilisation de tiroirs et de réfrigérateurs et interaction entre robots) sans aucun fine-tuning spécifique à la tâche. Le système combine un "cerveau" de 7B paramètres pour la compréhension et un modèle rapide de 80M paramètres pour le contrôle précis des mouvements.
Ainsi, plutôt que d'apprendre aux robots ne serait-ce qu’un seul nouveau comportement, Figure AI veut faire évoluer l'apprentissage de ces robots grâce à des modèles d'IA comme Helix qui embarque deux systèmes : un VLM embarqué pré-entraîné sur Internet fonctionnant à 7-9 Hz pour la compréhension de la scène et la compréhension du langage appelé S1 et une politique visuomotrice réactive rapide qui traduit les représentations sémantiques latentes produites en actions robotiques continues précises à 200 Hz appelé S2.
Un modèle capable de tourner sur des GPU embarqués
"Cette architecture découplée permet à chaque système de fonctionner à son échelle de temps optimale. S2 peut « penser lentement » à des objectifs de haut niveau, tandis que S1 peut « penser vite » pour exécuter et ajuster des actions en temps réel", assure la start-up.
Autre point important : Helix fonctionne entièrement sur des GPU embarqués à faible consommation d'énergie et ne nécessite que 500 heures d'entraînement, ce qui en fait un atout de taille pour son déploiement commercial.
Un changement de stratégie qui pourrait s'avérer payant
Figure AI a publié plusieurs vidéos de démonstration où l'on voit deux robots ranger des courses après avoir reçu des commandes à l'oral de la part d'une personne. L'objectif pour la start-up est de déployer ses robots à usage général aussi bien en entreprise qu'à domicile.
Cette avancée montre sa confiance dans le marché de la robotique pour la maison. "Pour que les robots soient utiles dans les foyers, ils devront être capables de générer de nouveaux comportements intelligents à la demande, en particulier pour des objets qu'ils n'ont jamais vus auparavant, assure l'entreprise. L’état actuel de la robotique ne pourra pas s’appliquer à la maison sans un changement radical".
SUR LE MÊME SUJET
Figure AI progresse dans la robotique pour la maison avec son modèle Helix
Tous les champs sont obligatoires
0Commentaire
Réagir