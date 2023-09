L'introduction de ChatGPT a éveillé le monde aux capacités de l'IA générative et à ses applications dans tous les secteurs. Alors que le potentiel de l'IA appliquée à la découverte de médicaments a été identifié depuis des années, désormais, l'accent est mis sur les grands modèles génératifs, lesquels vont considérablement accélérer l'adoption et la validation de ces outils pour la découverte biologique.



Les premiers résultats montrent que la transition vers les modèles génératifs constitue un point d'inflexion pour l'industrie. L’utilisation des grands modèles de langage (LLM) accélère notre compréhension de la biologie et améliore la qualité des premiers candidats-médicaments. Des représentations de meilleure qualité des médicaments et de leurs cibles améliorent aujourd'hui notre capacité à prédire leurs propriétés et leurs interactions.

Statu quo insuffisant

L'amélioration de la rapidité et de la qualité des pipelines de découverte de médicaments précliniques est directement liée à la découverte de nouvelles thérapies, permettant d'optimiser les résultats pour les patients et de sauver davantage de vies. Traditionnellement, la découverte de traitements est longue et coûteuse : après l'identification et l'optimisation d'une cible médicamenteuse, la probabilité d'une mise sur le marché réussie est inférieure à 10 %.



Des améliorations, même minimes, du délai d'optimisation des pistes et de la probabilité de succès clinique sont essentielles pour lutter contre les milliers de maladies pour lesquelles il n'existe aujourd'hui aucun traitement ou remède connu.

Les LLM apprennent le langage de la biologie

Les modèles d'IA générative d'aujourd'hui comprennent le langage de la biologie, de la chimie et de la génomique, en s'appuyant sur de nombreux outils qui ont été développés au cours des dernières années et qui ont conduit à l'avènement de ChatGPT et d'autres LLM. Bien que ces modèles aient déjà été appliqués aux données de séquences biopharmaceutiques (par exemple, la famille de modèles ESM (Evolutionary Scale Modeling) formés sur de grandes bases de données de séquences de protéines), le succès démontré d'AlphaFold de DeepMind a été l’étape décisive, démontrant les bénéfices de ces outils.



Depuis, il est difficile d'ignorer la croissance exponentielle de la R&D dans ce domaine ; pratiquement chaque semaine, de nouvelles architectures, de nouveaux modèles et de nouvelles approches de pointe sont publiés et mis à la disposition de l'industrie par le monde universitaire. Par exemple, DiffDock, le premier outil d'amarrage viable basé sur l'IA pour les petites molécules et les protéines, a récemment été mis sur le marché. Le cas échéant, ce modèle permet d'accélérer les flux de travail d'ancrage, ce qui se traduit par des flux de travail de criblage de petites molécules à la fois moins coûteux et plus efficaces.

Une prescription pour le succès

Chaque étape du pipeline de découverte de médicaments est accélérée par l'IA. Les LLM passent au crible le corpus pour découvrir de nouvelles cibles thérapeutiques. Les modèles génératifs formés sur les données relatives aux petites molécules et aux protéines fournissent des outils permettant de générer virtuellement des candidats-médicaments dotés de propriétés définies.



Les flux de travail d'apprentissage par représentation, tels que ceux soutenus par les modèles ESM dans la conception des protéines, fournissent les outils de prédiction des propriétés de la plus haute qualité connus à ce jour et contribuent directement à la performance des outils de prédiction de la structure tels qu'AlphaFold et ESMFold. Les applications de ces modèles à la génomique ont conduit au premier véritable modèle de base généralisable pour des tâches telles que la prédiction de l'expression des gènes, récemment publié par l'université technique de Munich et InstaDeep (aujourd'hui BioNTech).

Un point d'inflexion majeur

Nous sommes à un point d'inflexion majeur pour l'utilisation de l'IA dans la découverte précoce de médicaments, mais il en va de même pour les essais cliniques. Si nous disposons d'excellents outils génératifs et prédictifs pour les médicaments et leurs cibles, la question qui se pose naturellement est la suivante : comment pouvons-nous structurer plus efficacement un essai clinique afin de maximiser ses chances de succès pour un candidat-médicament donné ?



Des outils qui intègrent les données multimodales des patients, les dossiers médicaux électroniques, la génomique et d'autres représentations de la santé et de la biologie humaines sont en cours d’aider à identifier plus efficacement les patients pour les essais cliniques et à les aider à trouver eux-mêmes des essais.



Les capacités de l'IA générative à comprendre des relations complexes en langage naturel sont désormais, pour la première fois, à la portée de centaines de millions de personnes à travers le monde. L'impact de l'IA générative sur la biologie et la découverte de médicaments améliorera bientôt la vie de tous.



Nathaniel Ives, Directeur commercial Entreprise France chez Nvidia





