Recevez chaque jour toute l'actualité du numérique

x

Covid-19 : Un consortium public-privé compile 10 000 scanners pour créer des algorithmes de détection

Un consortium composé de l'AP-HP, GE Healthcare, Orange Healthcare, TheraPanacea se lance dans la constitution d'une base de données de 10 000 scanners thoraciques annotés par un groupe de 20 radiologues experts. L'objectif est de développer des algorithmes pour quantifier l'étendue des lésions pulmonaires liées au Covid-19. Compte tenu de la diversité des informations, l'intérêt de cet outil dépasse les enjeux actuels liés à la pandémie.
Twitter Facebook Linkedin Flipboard Email
×

Covid-19 : Un consortium public-privé compile 10 000 scanners pour créer des algorithmes de détection
Covid-19 : Un consortium public-privé compile 10 000 scanners pour créer des algorithmes de détection © National Cancer Institute-Unsplash

L'Assistance Publique - Hôpitaux de Paris (AP-HP), Orange Healthcare, GE Healthcare, TheraPanacea et la Société d'Imagerie Thoracique (SIT) annoncent le 15 juin 2020 une collaboration pour créer une base de données de 10 000 scanners thoraciques annotés de patients suspectés d'infection par le SARS-CoV-2. Ces informations serviront à créer des algorithmes de détection des lésions pulmonaires résultant de la maladie, mais aussi d'autres affections cardiothoraciques.

Un croisement de données

Cette collaboration vise à soutenir le projet "Scanner thoracique pour le diagnostic de la pneumonie liée au Covid-19" (STOIC) porté par le professeur Marie-Pierre Revel, cheffe de l'unité d'imagerie cardiothoracique de l'hôpital Cochin à Paris. "Il ne s'agit pas simplement de réunir des scanners de patients atteints du Covid-19, indique-t-elle à L'Usine Digitale. L'originalité de ce projet est l'annotation des scanners par des experts spécialisés en imagerie thoracique qui vont décrire les anomalies liées au Covid-19, mais aussi exploiter d'autres informations dans l'image sur l'état du patient (les artères coronaires, poumon malade…)."

Les lésions pulmonaires liées au Covid-19 sont contourées manuellement, "comme si nous dessinions les limites de la maladie", précise le professeur. Pour enrichir cette base de données, elle est reliée aux profils cliniques des patients (existence d'une hypertension, diabète, facteurs biologiques…).

Le groupe de 20 radiologues de la SIT utilise une application de visualisation d'image 3D développée par l'Américain GE Healthcare sur la plateforme EDISON et déployée par Orange Healthcare via un accès réseau et une infrastructure d'hébergement des données de santé sécurisée. "C'est environ 40 heures de travail pour les radiologues une fois les scanners extraits du serveur d'image. L'étape la plus longue est l'export des scanners à partir des réseaux d'images des hôpitaux. L'annotation elle-même est un outil cloud où nous nous connectons, nous visualisons les scanners et annotons en cliquant sur chaque élément", raconte Marie-Pierre Revel. Actuellement, les experts ont déjà annoté la moitié des 10 000 scanners. "Nous pourrions nous arrêter ici et nous aurions déjà de beaux résultats. Mais nous voulons aller plus loin", confie le professeur.

Développer des algorithmes

La base de données doit ensuite servir à développer des algorithmes pour, par exemple, quantifier rapidement et de façon automatique l'étendue et la sévérité des lésions pulmonaires. C'est l'entreprise parisienne TheraPanacea qui a été chargée de développer un pilote intégrant l'IA pour quantifier la maladie et établir un pronostic à court terme des patients à partir de leurs scanners pulmonaires d'entrée à l'hôpital.

"La qualité d'un algorithme repose en grande partie sur la qualité de l'information source. Si ces données ne sont pas excellentes, il n'en ressortira pas grand-chose", explique Marie-Pierre Revel. Raison pour laquelle le niveau minimal requis pour annoter les scanners était "chef de clinique spécialisé en imagerie thoracique". Autre élément fondamental : la diversité de données. "Les scanners ne devaient pas tous provenir de la région parisienne. Les hôpitaux de Rennes, Lyon et Strasbourg participent également au projet en fournissant des données", poursuit-elle.

"Compte tenu des annotations riches, la base de données pourra avoir d'autres objectifs que celui de la pandémie. Elle garde tout à fait son sens même si demain la maladie disparaît totalement", affirme Marie-Pierre Revel. En croisant l'ensemble des données non liées au Covid-19, le consortium pourra créer des algorithmes répondant à des problématiques très diverses. Et au-delà, le professeur indique que ce projet a été l'occasion de "voir un mode opératoire que nous pourrions reproduire". L'un des aspects à améliorer selon elle est la lourdeur du processus réglementaire européen, notamment sur l'anonymisation des données. "Même en étant accélérées, les procédures ont durée six semaines. C'est long quand on est dans l'urgence !", regrette-t-elle.

Réagir

* Les commentaires postés sur L’Usine Digitale font l’objet d’une modération par l’équipe éditoriale.

 
media