Facebook AI apprend aux robots à s'adapter en temps réel à différents terrains

Les chercheurs en intelligence artificielle de Facebook AI, Berkeley AI Research et de l'université Carnegie Mellon ont développé une nouvelle solution pour permettre aux robots articulés de se déplacer sur différents types de terrains, même s'ils ne l'ont jamais rencontré auparavant. Avec cette trouvaille les chercheurs espèrent développer des robots capables de soutenir les hommes dans les missions de recherche et de sauvetage.

Facebook AI apprend aux robots à s'adapter en temps réel à différents terrains © Facebook AI

Les équipes de Facebook AI Research, en partenariat avec des chercheurs de Berkeley AI Research et de l'école d'informatique de l'université Carnegie Mellon, ont dévoilé une nouvelle technologie d'intelligence artificielle qui permet aux robots de s'adapter en temps réel aux différents terrains qu'ils rencontrent. Baptisée "Rapid Motor Adaptation" (RMA), cette technologie permet à un robot articulé de s'adapter à son environnement en une fraction de seconde.

Que ce soit sur les sols rocailleux, huileux, pentus ou mous, les robots doivent être en mesure de s'adapter aux surfaces qu'ils rencontrent, aux objets qu'ils transportent et aux conditions dans lesquelles ils se trouvent, même s'ils n'ont jamais été exposés à ces conditions auparavant. L'objectif, pour éviter qu'ils ne tombent et ne risquent de se casser, est d'être capable d'assimiler l'environnement et s'y acclimater en quelques fractions de seconde.

Un apprentissage basé sur la simulation
Contrairement aux autres robots codés pour fonctionner dans un environnement donné, les chercheurs à l'origine du RMA se vantent d'être "allés au-delà d'un codage manuel car il est difficile, voire impossible, de préprogrammer un robot pour qu'il s'adapte à toutes les conditions du monde réel, qu'il s'agisse d'un type de tapis différent, d'une flaque de boue plus profonde ou d'un trampoline plus rebondi", détaillent-ils dans un communiqué. La RMA combine deux règles, toutes deux entièrement apprises lors simulation : une règle de base entraînée à l'aide d'un algorithme d'apprentissage par renforcement (RL) et un module d'adaptation entraîné par des technologies d'apprentissage supervisé.

Concrètement, les règles de base sont apprises en simulation avec des technologies d'apprentissage par renforcement et en utilisant des données sur différents environnements. Différentes variables sont établies (un sol plus ou moins glissant, différents degrés d'une pente, etc.) pour que le robot apprennent les bons mouvements selon différentes conditions. Puis, ces informations sont encodées comme étant des variables "extrinsèques".

Mais il n'est pas possible de déployer un robot uniquement avec ces règles puisqu'il est peu probable qu'il rencontre spécifiquement le même environnement (sauf s'il est conçu pour se déplacer toujours dans le même espace). Les chercheurs souhaitent donc que le robot se base également sur les informations qu'il apprend lui-même de son environnement (comme son dernier mouvement corporel). A partir de là il est possible de déterminer pourquoi le mouvement réalisé ne correspond pas au mouvement théorique en combinant le module d'adaptation du robot avec les règles de base qu'il a apprises (par exemple une jambe s'enfoncera plus sur une surface molle que sur une surface dure).
 

Réduire les coûts de la technologie
Après s'être entraîné en simulation, le robot a été capable de marcher sur du sable, de la boue, des sentiers de randonnée, des herbes hautes et un tas de terre sans la moindre défaillance durant les essais réels. Le robot a réussi à descendre des escaliers le long d'un sentier de randonnée dans 70% des essais et a réussi à naviguer sur un tas de ciment et un tas de cailloux dans 80% des essais, bien qu'il n'ait jamais eu affaire à certains de ces environnements durant la formation. Il a également maintenu sa hauteur avec un taux de réussite élevé lorsqu'il s'est déplacé avec une charge de 12 kg représentant 100% de son poids corporel.
 

À terme les chercheurs espèrent peaufiner davantage leur système et visent une augmentation de l'efficacité et une réduction des coûts pour que les "robots équipés de la RMA puissent un jour servir dans une multitude de cas, par exemple comme assistants dans les opérations de recherche et de sauvetage, en particulier dans les zones trop dangereuses ou peu pratiques pour les humains", ont dévoilé les chercheurs. "Nous sommes impatients de voir comment la communauté de recherche en IA s'appuiera sur notre travail avec la RMA, à la fois en robotique et au-delà", ont-ils conclu.