Nvidia lance son nouveau GPU H200 dédié à l'intelligence artificielle

Le géant américain des processeurs graphiques promet d'importants gains de performance, notamment pour l'inférence. Son nouveau GPU sera notamment déployé dans le supercalculateur exaflopique européen Jupiter, ainsi que chez les hyperscaleurs.

Partager
Nvidia lance son nouveau GPU H200 dédié à l'intelligence artificielle

Nvidia prépare l'arrivée de la concurrence sur le marché des puces dédiées à l’intelligence artificielle générative, qu'il domine très largement. Lundi 13 novembre, le géant américain des cartes graphiques a en effet officialisé son nouveau GPU conçu pour entraîner et faire tourner les derniers modèles d’IA.

Baptisé H200, ce GPU est le successeur du H100, dévoilé au printemps 2022 et entré en pleine production à l’automne. Soit quelques semaines à peine avant que le lancement de ChatGPT ne fasse exploser la demande pour ces composants. Depuis, Nvidia a dû augmenter ses capacités de production, sans pour autant satisfaire toute la demande.

“Une avancée de performance inédite”

L'accélérateur H200 s’appuie sur la même architecture que son prédécesseur. Mais il intègre désormais une mémoire HBM3e, plus rapide que la HBM3 utilisée jusqu’à présent. Cette évolution doit permettre “d’améliorer et d’accélérer de manière significative les applications de calcul haute performance et d'intelligence artificielle”, explique Nvidia.

Le groupe de Santa Clara promet ainsi “une avancée de performance inédite”, notamment pour l'inférence, le processus de génération des réponses. Les puces H200 doivent ainsi être 60% plus rapides que les H100 lorsqu’elles sont utilisées pour faire tourner GPT-3.5, l’avant-dernier grand modèle de langage d’OpenAI. Et 90% plus rapides pour Llama 2, le modèle open source de Meta.

AMD va lancer son premier GPU d'IA

Les GPU H200 seront déployés à partir du deuxième trimestre 2024 dans les data centers, à commencer par ceux d’Amazon Web Services, de Google Cloud, de Microsoft Azure et d’Oracle. Ils alimenteront aussi le supercalculateur exaflopique européen Jupiter, qui sera installé à Jülich, dans l'ouest de l’Allemagne. Ce dernier sera équipé de la "super puce" Grace Hopper 200, qui combine CPU et GPU reliés par NVLink et complété par de la mémoire HBM3e. L'intégrateur est Eviden avec son BullSequana XH3000.

L’annonce du H200 intervient alors que le rival AMD va lancer dans les prochaines semaines son premier GPU destiné à l’intelligence artificielle, baptisé MI300X. Sur le papier, cet accélérateur affiche de meilleures performances que les puces H100 de Nvidia. AMD assure ainsi que son composant est “le plus avancé du marché”. Mais pas pour très longtemps.

SUR LE MÊME SUJET

Sujets associés

NEWSLETTER L'Usine Digitale

Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.

Votre demande d’inscription a bien été prise en compte.

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes...

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes du : Groupe Moniteur Nanterre B 403 080 823, IPD Nanterre 490 727 633, Groupe Industrie Service Info (GISI) Nanterre 442 233 417. Cette société ou toutes sociétés du Groupe Infopro Digital pourront l'utiliser afin de vous proposer pour leur compte ou celui de leurs clients, des produits et/ou services utiles à vos activités professionnelles. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.

CHERCHE TALENTS NUMERIQUE

Les formations USINE DIGITALE

Toutes les formations

ARTICLES LES PLUS LUS