AMD contre-attaque face à Nvidia avec l'Instinct MI325X, façon David contre Goliath

Toutes les semaines, recevez l'essentiel de l'actu de l'IA

Partager
AMD contre-attaque face à Nvidia avec l'Instinct MI325X, façon David contre Goliath

A la Une

Face à Nvidia, AMD contre-attaque avec son nouveau GPU, l'Instinct MI325X. AMD ne chôme pas pour s'imposer dans les data centers face à Intel (avec beaucoup de succès) et Nvidia (avec difficulté). Conçus avec l’architecture AMD "Zen 5", les CPU Epyc série 9005 offrent des performances jusqu'à 28% plus rapide d'après la firme, de quoi alimenter les GPU en données pour les charges de travail d'IA les plus exigeantes. Les tests effectués sur Llama 3.1-8B de Meta s'avèrent prometteurs : les performances de débit sont 1,9 fois supérieures à celles de la concurrence - comprendre Nvidia et Intel.

L'autre annonce phare porte sur les accélérateurs Instinct MI325X, développés pour supporter la prochaine génération d'infrastructures d'IA à grande échelle. Les MI325X disposent d'une bande passante de 6,0 To/s. AMD annonce qu'ils peuvent fournir jusqu'à 1,3 fois les performances d'inférence du H200 sur Mistral 7B, 1,2 fois sur Llama 3.1 70B et 1,4 fois sur Mixtral 8x7B.

Côté calendrier, le fabricant prévoit une livraison en production au quatrième trimestre 2024 et une disponibilité sur les plateformes de fournisseurs tiers à partir du premier trimestre 2025. Un point qui pourrait jouer en sa faveur alors que Nvidia est en retard sur la livraison de ses puces Blackwell en raison de rendements insuffisants.

Dans l'actu

Meta déploie son assistant IA aux quatre coins du globe... Mais pas dans l'UE. Six nouveaux pays, incluant le Brésil et le Royaume-Uni, vont bientôt pouvoir profiter de Meta AI, son chatbot nouvelle génération tirant partie de ses LLM. A terme, ce sont même 43 pays qui en bénéficieront. Mais les utilisateurs européens peuvent toujours courir. La raison ? Les réglementations sur la protection des données personnelles empêchent Meta d'exploiter les données de ses utilisateurs à tout-va. L'entreprise refuse donc d'y sortir ses derniers produits.

"L'IA générative soulève des questions nouvelles et difficiles", Laurie Richardson, VP Trust & Safety, Google. Dans cet entretien, la vice-présidente de la Confiance et de la Sécurité de Google évoque les défis que représentent l'IA générative et la façon dont les pratiques évoluent pour mieux les relever. Au menu : tests de sécurité, gouvernance, déploiement progressif, conformité, et brossage des régulateurs dans le sens du poil.

MediaTek et Nvidia s'unissent contre Qualcomm pour développer une puce "PC IA". Le concepteur taïwanais de semi-conducteurs s'apprête à lancer une puce gravée en 3 nm selon le procédé de fabrication de TSMC pour les "PC AI", nouvelle catégorie à la définition vague que pousse Microsoft. Pour s'imposer face à Qualcomm et ses Snapdragon X Elite, MediaTek dispose d'un soutien de poids : Nvidia. La production de ce processeur pourrait débuter dès le second semestre 2025.

TSMC prévoit d'ouvrir de nouvelles usines en Europe. Le fondeur taïwanais a lancé la construction d'un premier site à Dresde pour y produire des composants automobiles. Les prochaines usines pourraient être dédiées à d'autres secteurs, dont l'IA générative, sans grande surprise. En quête de diversification de son activité dans le monde, TSMC mise aussi sur les subventions publiques qu'il pourrait obtenir : les États cherchent en effet à attirer les fabricants de semi-conducteurs, et sur ce terrain, force est de constater que les financements ne manquent pas.

Atlassian ouvre Rovo, son moteur de recherche dopé à l'IA, à tous ses clients. Six mois après le lancement de son moteur de recherche d'entreprise alimenté par l'IA, Atlassian dresse un premier bilan des usages et du retour sur investissement de ses outils auprès des utilisateurs. Pour l'éditeur australien, la clé réside dans la capacité à connecter un maximum de sources de données afin de garder ses usagers au maximum sur sa plateforme. Quitte à pousser l'automatisation un peu trop loin et rendre encore plus insignifiante la gestion de projet.

L'hallucination de la semaine

À combien est estimé le marché B2B de la robotique ? ChatGPT (4o mini) répond : "Le marché de la robotique pour le secteur B2B est en forte croissance et est estimé à plusieurs dizaines de milliards de dollars. Selon certaines prévisions, il pourrait atteindre entre 100 et 150 milliards de dollars d'ici 2025 ou 2030, selon les secteurs et les applications. Les avancées dans l'automatisation, la logistique, la fabrication et les services augmentent constamment la demande pour des solutions robotiques. Pour des chiffres précis, il est toujours bon de consulter des études de marché récentes."

Les applications métier

Logistique – Amazon embarque l'IA dans ses camionnettes pour livrer toujours plus vite

Passer de quelques minutes à chercher les bons colis à une seule ? C'est ce qu'espère Amazon avec son système de détection des colis embarqué dans ses camionnettes. Un déploiement progressif est prévu début 2025.

Télécoms Vodafone mise sur les smartphones Pixel de Google pour valoriser son réseau 5G

Vodafone mise sur les services d'IA de Google, intégrés au sein d'Android, pour valoriser son offre 5G. L'opérateur britannique va notamment proposer des abonnements AI Premium, qui incluront Gemini Advanced, sur certains marchés.

Luxe Entretien avec Axel Dumas, gérant d’Hermès : "Créer des emplois, c'est le plaisir d’une maison qui va bien"

Elu industriel de l'année 2024, Axel Dumas, gérant d’Hermès, sixième génération à la tête de l’entreprise, explique les évolutions du modèle artisanal de cette maison tournée vers la modernité. Face à l'essor de l'IA générative, force est de constater que même le secteur du luxe s'y met.

E-commerce Walmart lance ses propres LLM adaptés au retail

S'appuyant sur ses décennies de données amassées, le géant Américain de la grande distribution a développé une famille de LLM appelée Wallaby. Encore en phase de test, ces modèles pourraient changer l'expérience des consommateurs en ligne.

Et aussi

Sujets associés

NEWSLETTER L'Usine Digitale

Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.

Votre demande d’inscription a bien été prise en compte.

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes...

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes du : Groupe Moniteur Nanterre B 403 080 823, IPD Nanterre 490 727 633, Groupe Industrie Service Info (GISI) Nanterre 442 233 417. Cette société ou toutes sociétés du Groupe Infopro Digital pourront l'utiliser afin de vous proposer pour leur compte ou celui de leurs clients, des produits et/ou services utiles à vos activités professionnelles. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.

CHERCHE TALENTS NUMERIQUE

Les formations USINE DIGITALE

Toutes les formations