À l'occasion de la conférence Hot Chips 2021, IBM a dévoilé lundi 23 août les détails d'un nouveau processeur spécialisé dans l'inférence en intelligence artificielle, Telum. Conçu pour aider à lutter contre la fraude en temps réel, Telum est la première puce d'IBM à intégrer un accélérateur pour l'inférence. Un système utilisant Telum est prévu pour le premier semestre 2022.



Après trois ans de développement, cette puce a pour objectif "d'aider à obtenir des informations commerciales à grande échelle dans le secteur bancaire, financier, commercial et de l'assurance", indique la société. Cette puce est "idéale pour le travail des services financiers, à savoir la détection des fraudes, le traitement des prêts, la compensation et le règlement des transactions, la lutte contre le blanchiment d'argent et l'analyse des risques", a ajouté IBM dans un communiqué.



former des modèles d'IA hors plateforme

Dans le détail, la puce contient 8 cœurs fonctionnant à une fréquence de plus de 5 GHz. "L'infrastructure de cache et d'interconnexion des puces, entièrement repensée, fournit 32 Mo de cache par cœur et permettre d'utiliser jusqu'à 32 puces Telum. La conception du module à deux puces contient 22 milliards de transistors", détaille IBM.





Basée sur la technologie de Samsung

La puce a été construite sur une technologie ultraviolette extrême de 7 nm créée par Samsung en partenariat avec l'IBM Research AI Hardware Center. Selon Anthony Saporito, qui fait partie de l'équipe en charge du développement des systèmes IBM Z, "les caches L2 peuvent être combinés et former un cache L3 virtuel de 256 Mo". "Jusqu'à huit puces Telum être combinées pour former un cache L4 virtuel de 2 Go", a-t-il confié à ZDnet.



En mai, IBM Research a créé un semi-conducteur de test avec une fabrication en 2 nm qui améliorerait les performances de 45 % en utilisant la même quantité d'énergie ou utiliserait 75 % d'énergie en moins par rapport aux puces basées sur la technologie 7 nm. La société a annoncé que sa technologie 2 nm entrera en production vers la fin de 2024 pour une utilisation commerciale prévue vers 2025.