L'Institut Pasteur et IBM utilisent l'IA pour accélérer la découverte de médicaments contre le Covid-19

L'Institut Pasteur et IBM collaborent pour trouver un antiviral capable d'empêcher le virus du SARS-CoV-2 de pénétrer dans les cellules des muqueuses respiratoires humaines. Pour accélérer cette découverte, ils misent sur deux systèmes utilisant l'IA : Deep Search permet d'automatiser l'extraction de données importantes dans des publications scientifiques tandis que InDeep est capable de prédire le potentiel de fixation d'un futur médicament sur une protéine.

L'Institut Pasteur et IBM utilisent l'IA pour accélérer la découverte de médicaments contre le Covid-19 © Institut Pasteur

L'Institut Pasteur, spécialisé dans la prévention et le traitement des maladies infectieuses, et IBM ont mis en place un mécénat de compétences pour accélérer la recherche de traitements thérapeutiques dans le cadre de la pandémie de Covid-19 grâce à l'intelligence artificielle. L'objectif est de trouver un antiviral pour empêcher le virus de pénétrer dans les cellules humaines. Ce qui nécessite de trouver des structures de candidats-médicaments.

"Nous voulions apporter notre aide dans la lutte contre le Covid-19, raconte Xavier Vasques, directeur des centres technologiques d'IBM. Nous avons tapé à la porte de l'Institut Pasteur pour savoir comment nous pouvions les aider." L'unité de Bioinformatique structurale, dirigée par le directeur de la technologie de l'Institut Pasteur Michael Nilges, a répondu favorablement à cette demande. 

Prédire le potentiel de fixation d'un médicament
A cette époque, les scientifiques de l'unité avaient déjà amorcé "le développement de l'architecture de modèles de prédiction de sites fonctionnels particuliers à visée thérapeutique", raconte Olivier Sperandio, chercheur au sein de l'unité de Bioinformatique structurale à l'Institut Pasteur. Avec son équipe, il a développé le système "InDeep" qui est capable, à partir de la structure en 3 dimensions d'une protéines-cible, de "scruter et analyser le repliement, la forme tridimensionnelle et la présence de cavités" pour prédire "le potentiel de fixation d'un futur médicament". "L'arrivée d'IBM nous a permis de changer d'échelle en matière de développement et d'optimisation", ajoute le scientifique. 

C'est l'outil "Deep Search" développé par IBM qui a particulièrement intéressé les chercheurs. Cet algorithme est capable d'effectuer des requêtes spécifiques dans des millions de publications scientifiques pour en extraire des informations précises. "Une recherche qui mettrait 10 à 20 ans pourrait être réduite à une année, quelques mois ou quelques semaines", détaille Xavier Vasques.

Déjà largement utilisé dans l'industrie des matériaux, de l'automobile et de l'énergie, cet outil présente de nombreux avantages dans le cadre de la pandémie de Covid-19, qui a vu le nombre de publications scientifiques explosé. L'Express rapportait en juin dernier que depuis le début de l'année, 20 000 études en lien avec le Covid-19 avaient déjà été publiées.

Extraire des informations et les recouper
Il est par exemple possible de demander à Deep Search quels sont les médicaments qui ont déjà été utilisés jusqu'à présent et quels ont été les résultats. "C'est plus qu'un simple moteur de recherche. Deep Search est capable de lire des tableaux, d'extraire des chiffres… pour pouvoir lier des articles entre eux et en déduire un certain nombre d'hypothèses", précise Xavier Vasques.

Ces capacités ont séduit l'unité de Bioinformatique structurale. "Deep Search permet d'extraire des informations sur de petites molécules dans des documents, comme dans des brevets. Ce qui est très compliqué à faire car elles sont noyées dans des tableaux", déclare Olivier Sperandio. "Nous avons réalisé que la technologie que nous développions (InDeep, ndlr) pouvait se mettre en parfaite adéquation avec cette technologie, c'est-à-dire de croiser le monde de données auquel pouvait nous donner accès Deep Search avec le monde de la prédiction de sites fonctionnels", poursuit le chercheur. 

En pratique, l'un des objectifs de l'Institut Pasteur est de développer un antiviral qui cible les protéines indispensables au cycle du SARS-CoV-2. Ce type de traitement agit à un moment précis du cycle de réplication du virus pour le bloquer. Dans le cas du Covid-19, c'est la protéine Spike (ou protéine S) qui permet au virus de pénétrer dans les cellules humaines via la récepteur ACE2, une protéine se trouvant à la surface des cellules des muqueuses respiratoires. "C'est par cette interaction transitoire que le virus va envahir l'organisme", détaille Olivier Sperandio.

Des premiers résultats encourageants
L'objectif est donc de trouver "une petite molécule qui empêcherait les deux protéines (Spike et ACE2, ndlr) de se parler". Une tâche particulièrement difficile, longue et fastidieuse d'où l'utilisation de l'intelligence artificielle qui permet d'automatiser une partie du travail. InDeep a ainsi permis "d'identifier des sites fonctionnels à la surface des protéines ACE2 et Spike. Puis nous utilisons ces informations pour mieux calibrer l'identification de petites molécules à visée thérapeutique". L'objectif est d'identifier des zones indispensables à "la pathogénicité du virus" sur lesquelles viendrait se fixer un traitement antiviral.

Mais le chemin est encore très long avant qu'un antiviral puisse être commercialisé. Bien que le recours à l'IA raccourcisse certains délais et que l'arrivée d'un vaccin contre le Covid-19 a été exceptionnellement rapide, "le développement d'un médicament est très long. Cela prend environ 15 ans", rappelle Olivier Sperandio. "C'est encore de l'ordre de la science-fiction", ajoute-t-il ne souhaitant pas se prononcer sur une future date de commercialisation