Recevez chaque jour toute l'actualité du numérique

x

La feuille de route du CNRS pour promouvoir "la culture de la donnée" dans la recherche scientifique

Le CNRS détaille son plan d'action pour booster l'open data des données de recherche scientifique. L'objectif est de faire émerger de nouvelles connaissances par le truchement des données issues de différents travaux, tout en garantissant la confidentialité de certaines informations, telles que des secrets industriels ou des données personnelles. Et trouver un équilibre autour de ce maître-mot : "ouvert autant que possible, fermé autant que nécessaire".
Twitter Facebook Linkedin Flipboard Email
×

La feuille de route du CNRS pour promouvoir la culture de la donnée dans la recherche scientifique
La feuille de route du CNRS pour promouvoir "la culture de la donnée" dans la recherche scientifique © National Cancer Institute/Unsplash

Le Centre national de la recherche scientifique (CNRS), qui regroupe plus de 1100 laboratoires en France et à l'étranger, présente sa feuille de route pour rendre les données de la recherche accessibles et réutilisables. Le but : inciter les chercheurs à mettre leurs résultats à la disposition de leurs pairs.

Textes, logiciels, algorithmes...
Concrètement, il s'agit de "données brutes, ou retraitées dans tous leurs formats, les textes et documents, les logiciels, algorithmes, protocoles", détaille Alain Schuhl, directeur général délégué à la science, dans une interview publiée sur le site du CNRS. Il note également que le volume et la diversité de données ne cessent d'augmenter avec "l'apparition de nouvelles technologies, une automatisation croissante et, par exemple, les nouvelles possibilités d’analyse offertes par l’intelligence artificielle".

Un atout pour la création de deep tech
Les avantages issus de l'open data des données scientifiques sont nombreuses. "La mise à disposition des données attachées à une publication scientifique est indispensable pour comprendre, reproduire et valider un résultat scientifique, explique Alain Schuhl. Partager ces données permet aussi à d’autres équipes de les réutiliser sans avoir à les générer une nouvelle fois, ce qui permet un gain de temps et assure une meilleure utilisation des fonds de la recherche."

Prévu par la Loi Lemaire de 2016 pour une "République numérique", l'open data des données de la recherche favorise la création de nouvelles connaissances par le croisement des travaux de différentes équipes qui parfois travaillent dans des disciplines très éloignées. C'est également un atout pour le développement des "deep tech" en France, ces start-up généralement issues de travaux universitaires.

Rendre les données "FAIR"
Mais cette "culture de la donnée" est loin d'être évidente pour tous les scientifiques. "C’est parfois un véritable changement de culture qui est nécessaire", indique Alain Schuhl. "Il faut donc faire évoluer les pratiques et les mentalités tout autant que développer des outils pour la gestion, le partage, la préservation à long terme et la diffusion des données", poursuit-il.

Il faut rendre les données "FAIR", c'est-à-dire faciles à trouver, accessibles, interopérables, réutilisables, dès la conception des projets de recherche, détaille le directeur général délégué à la science. En pratique, le programme d'action recommande la création d'une cartographie des données produites par les différentes unités de recherche composant l'organisme public de recherche. Elle permettra d'identifier les lieux de production des données (infrastructures et/ou expérience de laboratoires), les lieux de stockage des données, la quantité de données produites, les politiques de partage et de conservation des données au sein des unités…

Créer un cahier de laboratoire informatisé
De plus, le CNRS veut favoriser la création de nouveaux outils de gouvernance. Il note que certaines données se perdent bêtement car elles ne sont pas correctement stockées. Pour répondre à cette problématique, il propose la mise en place d'un "répertoire des recherches" ou un "cahier de laboratoire informatisé" pour faire le lien vers "le serveur hébergeant les données".

Pour les données de "longue traîne", soit les informations issues du développement des techniques d’imagerie et les capteurs distribués, la CNRS envisage la création d'un entrepôt "institutionnel". Cet outil devra s'articuler avec l’initiative en cours du Ministère français de l'Enseignement supérieur, de la Recherche et de l'Innovation qui étudie la faisabilité d’un entrepôt national de données "simples".

Former les personnels à la culture de la donnée
Le plan d'action comprend un volet "formation", indispensable pour encourager la culture de la donnée. Tous les types de personnels doivent être sensibilisés au sujet. Cette sensibilisation doit reposer sur "des échanges de bonnes pratiques", les "leçons tirées de l’implantation de FAIR" et de "la définition des limites légitimes de l’ouverture des données".

Pour remplir ces objectifs, une nouvelle Direction fonctionnelle des données ouvertes de la recherche (DDOR), rattachée à la Direction générale déléguée à la science (DGDS), aura pour mission de proposer et d’accompagner la mise en application d’une politique et d’une stratégie pour l’ouverture des données au sein du CNRS. Un administrateur de données devra également être mis en place pour représenter le CNRS au sein du réseau que le Ministère de l'Enseignement supérieur est en train de constituer.

Réagir

* Les commentaires postés sur L’Usine Digitale font l’objet d’une modération par l’équipe éditoriale.

 
media