C'est le top départ pour le programme et équipement prioritaire de recherche (PEPR) exploratoire "MoleculaArXiv", piloté par le Centre national de la recherche scientifique (CNRS), qui vise à inventer de nouveaux dispositifs de stockage sur ADN et polymères artificiels.



Stocker les données "froides"

"Alors que la croissance de ces données est exponentielle, les capacités de stockages, elles, ne suivent pas", explique Marc Antonini, directeur de recherche CNRS au Laboratoire d'Informatique, Signaux et Systèmes de Sophia Antipolis (CNRS/Université Cote d’Azur). Les données dites "froides" – peu utilisées comme "des documents légaux" ou de "vieux emails" – sont particulièrement concernées puisqu'elles représentent "60% à 80%" de toutes les données stockées sur la planète.



"C'est pour cela que nous cherchons des solutions alternatives, pérennes et à faible consommation énergétique pour stocker les données", résume le directeur de recherche. Doté d'un budget de 20 millions d'euros sur 7 ans, le PEPR se concentre sur quatre projets : les technologies de synthèse d'ADN de nouvelle génération, le stockage efficace selon différentes stratégies de codage et de séquençage, la généralisation du support de stockage d'information sur polymère synthétique et le stockage moléculaire pratique, sûr et exploitable. Une autre partie du budget sera dédiée à des appels à projet et des appels à manifestation d'intérêt vers les laboratoires intéressés ainsi qu'à l'animation scientifique.

Une première expérience menée avec succès

Menées au sein de 16 laboratoires, ces recherches ont vocation à rassembler un savoir-faire national, soutenir le transfert de futures technologies, la création de start-up et d'obtenir un programme de recherche européen sur le sujet. A ce titre, le CNRS est entouré de partenaires tels que l’Institut national de l’audiovisuel (INA), le Parlement européen ou encore la Bibliothèque nationale de France (BnF) et la bibliothèque universelle de codes sources de logiciels, Software Heritage, avec lesquels il souhaite mettre en place des expériences réelles d’archivage de données à grande échelle. Une première expérience a été menée avec succès : des chercheurs français ont encodé la Déclaration des droits de l'Homme sur des molécules d'ADN.



Techniquement parlant, ces recherches n'utilisent pas l'ADN biologique mais de l'ADN de synthèse dans lequel "les scientifiques construisent des séquences qui ne comportent pas de gène", précise Marc Antonini. L'ADN est inséré dans une mini capsule métallique, que développe actuellement la société française Imagene. Elle peut stocker des millions de brins d'ADN (donc des données) de façon très compacte. "En théorie, une seule de ces capsules pourrait contenir l’équivalent d’un data center – on peut donc imaginer les gains énergétiques, mais également d’espace sur le territoire", schématise-t-il.

Les data centers existeront toujours

Ces recherches s'annoncent prometteuses mais il faut rester réaliste. "Le stockage de données ne va pas complètement changer du jour au lendemain", explique le scientifique. En effet, il y aura "une coexistence entre les données dites 'chaudes' qui resteront au format binaire et stockées sur des systèmes traditionnels". Enfin, et c'est important de le préciser, l'objectif de ce programme n'est pas de remplacer "totalement" les data centers "d'ici 10 ans".



Le stockage sur ADN est également un sujet de compétition internationale. Les Etats-Unis sont en avance sur l'Europe. En 2019, ils ont mis en place le programme "Molecular Information Storage" doté d'un budget de 50 millions d'euros. Ils ont notamment fait appel à la pépite française DNA Script, qui a reçu un financement de 23 millions de dollars par l'Intelligence Advanced Research Projects Activity (IARPA), agence en charge de la recherche de pointe rattachée au bureau des renseignements américain.