Recevez chaque jour toute l'actualité du numérique

x

Amazon lance Trainium, une nouvelle puce conçue pour entraîner des modèles de machine learning

Dans le cadre de son événement annuel dédié au cloud computing, re:Invent, AWS a dévoilé Trainium, une puce spécifiquement conçue pour entraîner des modèles d'intelligence artificielle dans le cloud.  
Twitter Facebook Linkedin Flipboard Email
×

Amazon lance Trainium, une nouvelle puce conçue pour entraîner des modèles de machine learning
Amazon lance Trainium, une nouvelle puce conçue pour entraîner des modèles de machine learning © AWS

A l’occasion de son événement annuel re:Invent, qui se tient du 30 novembre au 18 décembre à Las Vegas, Amazon a présenté AWS Trainium, un puce conçue en interne et dédiée à l'entraînement de modèles de machine learning.

Trainium permettra à Amazon de se démarquer de la concurrence, l'entreprise affirmant que la puce conférera à ses instances cloud le plus de téraflops du marché pour cette tâche spécifique. Elle promet des débits 30% supérieurs et des coûts d’inférence 45% inférieurs aux instances AWS équivalentes basées sur des GPU. Les performances affichées, dont une augmentation "significative" de la bande passante mémoire, que propose Amazon à un coût moins élevé. A noter cependant que le géant américain ne donne aucun détail technique comme la finesse de gravure.

Une commercialisation au second semestre 2021
Trainium prendra en charge les frameworks de machine learning les plus populaires, comme TensorFlow (Google), PyTorch (Facebook) et MxNet. Amazon explique que Trainium utilise le même SDK Neuron qu’Inferentia, son autre puce maison hébergée dans le cloud. Celle-ci a vocation à remplacer les processeurs Nvidia pour l'inférence, notamment le traitement des requêtes d'Alexa, son assistant vocal, et de Rekognition, son logiciel de reconnaissance faciale. Le géant de Seattle a annoncé en novembre avoir commencé la transition de ses data centers vers Inferentia.

Trainium doit aussi permettre à Amazon de concurrencer les TPU développés par Google pour sa plateforme cloud. Ce dernier s'apprête à sortir sa 4e génération de puces, dont les performances doubleraient par rapport aux TPU actuels. A noter qu'Amazon prépare par ailleurs la disponibilité d'instances EC2 basées sur les puces Habana Gaudi d'Intel. Ces dernières sont également spécialisées dans l'entraînement de modèles d'IA. Mettra-t-il Intel en concurrence avec ses propres designs ? Réponse au second semestre 2021, lorsque Trainium sera disponible.

Réagir

* Les commentaires postés sur L’Usine Digitale font l’objet d’une modération par l’équipe éditoriale.

 
media