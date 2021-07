Nvidia donne le coup d'envoi pour son supercalculateur Cambridge-1 ce 7 juillet. Basé au Royaume-Uni, dans la ville de Cambridge dont il emprunte le nom, le système est dédié à la recherche médicale. Il s'agit du premier superordinateur construit par Nvidia pour la recherche externe et représente un investissement de 100 millions de dollars.



Cinq partenaires de recherche sont présents au lancement : AstraZeneca, GSK, Guy’s and St Thomas’ NHS Foundation Trust, King’s College London, et Oxford Nanopore, un partenaire de longue date de l'entreprise. Les premiers projets pour lesquels servira Cambridge-1 concernent l'étude de maladies cérébrales, l'utilisation de techniques d'intelligence artificielle pour concevoir de nouveaux médicaments et la découverte de variations dans le génome humain pouvant causer des maladies.



Apprentissage auto-supervisé sur de grands ensembles de données

Le principal projet d'AstraZeneca est basé sur une méthode d'apprentissage auto-supervisé, qui s'appuie un très grand ensemble de données et permet d'éviter d'avoir à étiquetter manuellement les données utilisées pour entraîner le modèle. Nommé MegaMolBART, le modèle sert à prédire les réactions face à de nouvelles molécules médicameteuses et à optimiser le processus de développement de ces dernières. Il est entraîné sur la base de données ZINC et sera à terme mis à disposition en open source.





GSK de son côté se concentre sur l'analyse génétique pour sélectionner au mieux les molécules ayant le plus de chance de devenir des médicaments et d'être commercialisées. Le King’s College London et le Guy’s and St Thomas’ NHS Foundation Trust utiliseront Cambridge-1 pour générer des images cérébrales synthétiques après avoir entraîné un modèle sur des dizaines de milliers d'IRM du cerveau. Leur objectif est de mieux comprendre le développement de maladies comme la démence, les AVC, la sclérose en plaques ou les cancers du cerveau, et ainsi de pouvoir les détecter et les traiter plus rapidement.



Un cluster composé de 80 systèmes DGX A100

Le supercalculateur, qui est hébergé chez Kao Data, est composé de 80 systèmes DGX A100 connectés comme cluster DGX SuperPOD. Il développe 400 pétaflops pour les calculs liés à l'intelligence artificielle et 8 pétaflops de performance sur benchmark LINPACK. Il figure d'après Nvidia parmi les 50 supercalculateurs les plus puissants au monde. Sur le plan logiciel, il s'appuie sur Nvidia Clara.



A noter que Nvidia travaille en parallèle sur un autre supercalculateur, lui aussi basé à Cambridge, dans le cadre de son projet de rachat d'Arm. Il se situera dans son futur "AI Center for Excellence".