Un groupe d'industriels utilise l'apprentissage fédéré pour accélérer la découverte de médicaments

Comment collaborer sans partager des données sensibles ? C'est sur cette problématique qu'a voulu se pencher un consortium d'entreprises pharmaceutiques, de start-up et d'universités pour découvrir des molécules prometteuses grâce à l'IA. Ils ont développé une plateforme, dans le cadre d'un projet financé par l'UE, reposant sur l'apprentissage fédéré : la division des tâches d'entraînement d'un algorithme sur plusieurs machines tout en conservant la confidentialité des données. En trois ans, elle a permis d'élaborer plusieurs modèles.

Partager
Un groupe d'industriels utilise l'apprentissage fédéré pour accélérer la découverte de médicaments

Lancé en 2019, le projet "Melloddy" présente ce 13 juillet ses résultats dans le développement et l'exploitation d'une plateforme sécurisée permettant l'apprentissage fédéré sans partager les données de chaque partenaire pour la découverte de molécules prometteuses.

17 partenaires

Financé à hauteur de 18 millions d'euros sur trois ans par l'Union européenne dans le cadre de l'Initiative pour les médicaments innovants (IMI2), ce projet a rassemblé 10 industriels pharmaceutiques (Novartis, Servier, Janssen, Merck…), quatre start-up et PME ainsi que deux universités. Nvidia était également membre du consortium.

Le constat était le suivant : les entreprises pharmaceutiques disposent de librairies de molécules sur lesquelles des expériences sont menées. "C'est leur trésor de guerre", déclare Mathieu Galtier, chief product officer au sein de la start-up française Owkin, membre du projet, à L'Usine Digitale. Or, en combinant leurs forces, elles pourraient considérablement accélérer la découverte de molécules prometteuses et donc de médicaments. D'où la naissance du projet Melloddy.

Le recours à l'apprentissage fédéré

Melloddy a "permis de faire une collaboration d'un nouveau type : nous avons rassemblé 10 entreprises habituellement en compétition pour les faire travailler ensemble", explique Mathieu Galtier. En effet, ces entreprises ne veulent pas partager leurs données stratégiques avec leurs concurrents. Raison pour laquelle la plateforme développée repose sur l'apprentissage fédéré qui permet "d'entraîner un modèle de machine learning sur toutes les données des entreprises pharmaceutiques sans avoir à partager ces données".

C'est Owkin qui a apporté la brique technologique relative à l'apprentissage fédéré. "Au lieu de faire circuler les données, ce sont les algorithmes et les modèles qui vont bouger entre les différents serveurs, détaille le chief product officer. Les données sont ainsi sanctuarisées et restent derrière les firewalls au sein des entreprises pharmaceutiques." Ce système permet de s'assurer que "les données rentrent dans les modèles uniquement en tant qu'informations agrégées".

En trois ans, le projet Melloddy a ainsi permis d’élaborer des modèles qui se basent sur des milliards de points de données expérimentales issues de l’industrie, documentant le comportement de plus de 20 millions de petites molécules chimiques dans le cadre de plus de 40 000 essais biologiques.

Une meilleure performance grâce à la collaboration

Le résultat est clair : le recours à cette technologie permet d'obtenir des modèles plus performants. Pour évaluer l’amélioration des modèles tout en tenant compte de la grande variété des essais, pour chaque modèle multipartenaire, la proximité d’un score parfait a été comparée avec celle du modèle correspondant élaboré par un partenaire unique. Dans les détails, pour l’ensemble des partenaires pharmaceutiques, la performance des modèles collaboratifs affichait une supériorité moyenne de 4% pour la classification des molécules comme soit actives, soit inactives sur le plan pharmacologique ou toxicologique.

Reste la question de la paternité de la découverte d'une molécule. "Nous avons décidé de fixer le principe suivant : le modèle entraîné par les données revient à toutes les entreprises pharmaceutiques, indique Mathieu Galtier. En revanche, toute la recherche à partir de ce modèle appartient à l'entreprise concernée."

De nombreux cas d'usage dans la santé

Le projet Melloddy est mis "sur pause" quelques temps puis reprendra "avec des consortiums différents". En effet, les cas d'usages sont multiples : les anticorps, les données patients, la génomique… Le but est évidemment de pouvoir commercialiser ce système.

SUR LE MÊME SUJET

Sujets associés

NEWSLETTER L'Usine Digitale

Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.

Votre demande d’inscription a bien été prise en compte.

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes...

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes du : Groupe Moniteur Nanterre B 403 080 823, IPD Nanterre 490 727 633, Groupe Industrie Service Info (GISI) Nanterre 442 233 417. Cette société ou toutes sociétés du Groupe Infopro Digital pourront l'utiliser afin de vous proposer pour leur compte ou celui de leurs clients, des produits et/ou services utiles à vos activités professionnelles. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.

ARTICLES LES PLUS LUS