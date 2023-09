Intel semble avoir enfin trouvé un moyen de répondre à la demande explosive en GPU à des fins d'entraînement et d'exécution des modèles d'intelligence artificielle. Il annonce le 19 septembre que "l'un des supercalculateurs les plus puissants d'Europe" va être construit uniquement sur la base de ses technologies, avec des CPU Intel Xeon de 5e génération et 4000 accélérateurs Gaudi 2. Stability AI, start-up à l'origine du modèle Stable Diffusion, en sera le premier gros client.



Les accélérateurs Gaudi sont le fruit de Habana Labs, société israélienne rachetée en décembre 2019 pour 2 milliards de dollars. Intel avait déjà tenté de s'imposer sur ce segment au milieu des années 2010 en acquérant Nervana Systems, mais ce fut un échec. Lors de sa conférence Innovation 2023, Intel a présenté Gaudi 2 comme "la seule alternative viable sur le marché".

"La seule alternative à Nvidia"

Alternative à qui ? Nvidia bien sûr, qui dispose d'une avance considérable et domine complètement le marché. Intel en est bien conscient et fait preuve de réalisme à ce sujet. Lors d'une session technique, il présentait Gaudi 2 comme pouvant atteindre de meilleures performances qu'un GPU A100 pour faire de l'inférence sur ESM2-Fold de Meta AI. L'entreprise met aussi en avant ses performances d'inférence récentes sur le benchmark MLPerf.







Si Intel n'est pas en mesure de faire mieux que les H100 de Nvidia, il dispose d'un argument imparable : la supply chain. Nvidia n'arrive pas à répondre à la demande aujourd'hui, et cette opportunité n'a pas échappé au géant de Santa Clara, qui cherche à passer à faire monter sa production en régime "le plus vite possible". Dell offrira une solution PowerEdge combinant processeurs Xeon et Gaudi.



Pat Gelsinger, à l'origine du renouveau d'Intel depuis son retour en tant que CEO, a par ailleurs réitéré son ambition de faire un jour de Nvidia un client d'Intel Foundry Services lors d'un briefing. "C'est un super partenaire à de nombreux égards et un client potentiel. Certes, nous sommes concurrents sur certains marchés, mais Jensen est avant tout un ami de 30 ans." C'est dit. Il souligne également l'intérêt marqué de Jensen Huang (CEO de Nvidia) pour les chiplets et le standard d'interconnect UCIe dont Intel est à l'origine.

Gaudi 3 sur les rails, de même qu'un combo Gaudi/GPU

Mais Intel a évidemment plus d'ambition. La prochaine génération d'accélérateur signée Habana, Gaudi 3, sera gravée en 5 nm (contre 7 nm), et verra ses capacités multipliées : puissance de calcul 2x, bande passante réseau 1,5x, mémoire HBM 1,5x, bfloat16 4x. Intel travaille de plus sur un autre système au nom de code "Falcon Shores" qui combinera un accélérateur Gaudi et un GPU Arc. Prévu pour quand ? Mystère.







Quid de CUDA, qui verrouille l'écosystème ? Greg Lavender, CTO d'Intel et dirigeant de sa division software, mise sur son "ouverture" face à ces "technologies propriétaires", ce qui fait d'après lui que l'industrie sera disposée à faire un effort. Il évoque aussi l'exploration de méthodes de GenAI pour générer du code qui pourra tourner sur n'importe quel hardware. Plus facile à dire qu'à faire.



Intel compte aussi sur la synergie avec ses CPU pour convaincre. Zhou Jingren, CTO d'Alibaba Cloud a témoigné de gains de performance 3x pour ses modèles d'IA générative Tongyi avec la 4e génération de Xeon, et Intel en promet encore d'autres pour la 5e génération qui sera commercialisée le 14 décembre 2023.



Elle sera suivie au premier semestre 2024 par Sierra Forest, qui sera doté d'E-cores (des coeurs conçus pour l'efficacité énergétique) et permettra "une densité de rack multipliée par 2,5" et "des performances par watt multipliées par 2,4" par rapport aux Xeon de 4e génération. Un modèle à 288 coeurs est prévu. Granite Rapids, équipé de P-cores (pour un maximum de performances), suivra peu après et offrira "deux à trois fois plus de performances pour l'IA que les Xeon de 4e génération". Clearwater Forest (E-cores) est prévu pour 2025.