Nvidia dévoile une nouvelle "super puce" dédiée à l'IA générative

Le groupe américain souhaite préserver sa position dominante sur le marché, avec cette nouvelle puce dédiée à l'inférence des derniers modèles d’IA générative.

Partager
Nvidia dévoile une nouvelle

C’est le symbole d'une incroyable course de vitesse. Mardi 8 août, Nvidia a officiellement dévoilé une nouvelle version de sa “super puce” GH200, dédiée à l’intelligence artificielle générative, alors même que la commercialisation de la précédente génération ne débutera qu’en septembre.

Mémoire revue à la hausse

Comme sa grande sœur, cette nouvelle puce combine un CPU Grace à 72 cœurs avec un GPU H100, spécialement conçu pour l'accélération des calculs liés à l'IA. La nouveauté provient de la mémoire associée. Celle-ci passe de 96 Go de mémoire HBM3 à 141 Go de mémoire HBM3e, qui est “50% plus rapide que l’actuelle HBM3”, selon Nvidia.

La nouvelle GH200 devrait entrer en production avant la fin de l’année, pour une commercialisation prévue au deuxième trimestre 2024. Elle cohabitera avec la précédente génération. Celle-ci reste au cœur d’un nouveau supercalculateur, baptisé DGX GH200, capable d’entraîner les prochains modèles d’IA générative.

Baisse des coûts

L’extension de la mémoire doit permettre à la dernière GH200 de faire tourner les modèles d’IA les plus avancés sur un seul système, équipé d’une ou deux "super puces". "Le coût de l'inférence va diminuer de manière significative", promet ainsi Jensen Huang, le cofondateur et patron du spécialiste des GPU, qui s’exprimait dans le cadre de la conférence Siggraph, organisée à Los Angeles.

Cette annonce intervient deux mois après la présentation d’une puce concurrente par AMD, qui mettait en avant une mémoire de 192 Go. Elle doit permettre au géant américain de conserver sa position archi-dominante sur ce marché en très forte croissance. Une position qui lui a permis de franchir au printemps la barre symbolique des 1000 milliards de dollars de capitalisation boursière.

SUR LE MÊME SUJET

Sujets associés

NEWSLETTER L'Usine Digitale

Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.

Votre demande d’inscription a bien été prise en compte.

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes...

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes du : Groupe Moniteur Nanterre B 403 080 823, IPD Nanterre 490 727 633, Groupe Industrie Service Info (GISI) Nanterre 442 233 417. Cette société ou toutes sociétés du Groupe Infopro Digital pourront l'utiliser afin de vous proposer pour leur compte ou celui de leurs clients, des produits et/ou services utiles à vos activités professionnelles. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.

ARTICLES LES PLUS LUS