Lancement d’un programme et équipement prioritaire de recherche exploratoire pour le stockage de données sous forme d’ADN
Piloté par le CNRS, le programme et équipement prioritaire de recherche (PEPR) exploratoire MoleculArXiv1 vise à inventer de nouveaux dispositifs de stockage de données sur support moléculaire, à la fois ADN et polymères artificiels. Lancé ce 30 mai 2022, il est doté d’un budget de 20 millions d’euros sur 7 ans, financé dans le cadre du PIA 4.
- 1Les PEPR exploratoires visent des secteurs scientifiques ou technologiques en émergence pour lesquels l’Etat souhaite identifier et structurer ces communautés. Ils sont financés dans le cadre du volet recherche du PIA 4 et du plan France Relance. Les PEPR exploratoires sont issus d’une sélection drastique par un jury international.
La quantité de données stockées sur la planète est estimée à 175 zettaoctets2
d’ici 2025. Si l’on pouvait stocker cette quantité de données sur des disques Blu-ray, il faudrait disposer de 23 piles de disques, chaque pile ayant une hauteur équivalente à la distance Terre-Lune. Alors que les quantités de données augmentent, les capacités de stockage se font dépasser. Il est donc nécessaire de chercher des solutions de stockage alternatives, pérennes et à faible consommation énergétique alors que certains data centers ont un bilan carbone équivalent à celui d’une ville entière. Pour répondre à ces enjeux, l’ADN synthétisé de façon chimique, qui dispose de larges et longues capacités de stockage sans consommation énergétique, s’impose comme l’une des solutions d’avenir.
Le PEPR MoleculArXiv vise à développer un programme ambitieux d’accélération, de conception et d’arrivée sur le marché de nouveaux dispositifs de stockage de données sur support moléculaire. Pour mettre en œuvre son action, il initiera des recherches au sein de 16 laboratoires choisis afin d’accentuer les connaissances sur la chimie de synthèse de l’ADN ; l’encodage et le séquençage de l’ADN ; et la structure de la donnée au sein de l’ADN. Ces recherches pluridisciplinaires s’appuieront sur la chimie, la microfluidique, le traitement du signal, la bioinformatique, la biologie du séquençage et la chimie des polymères. Le PEPR aura ainsi pour vocation de rassembler un savoir-faire national et soutenir le transfert de futures technologies via une montée en TRL – autrement dit un passage de la conception à la fabrication - et la création de start-up, mais également – au niveau européen – d’obtenir un programme de recherche européen sur le sujet, un FET Flagship (ou « Initiative-phare des technologies futures et émergentes » en français).
Le PEPR consacrera son budget au sein des 16 laboratoires directement impliqués qui mèneront quatre projets ciblés – respectivement sur les technologies de synthèse d’ADN de nouvelle génération ; le stockage efficace selon différentes stratégies de codage et de séquençage ; la généralisation du support de stockage d’information sur polymères synthétiques ; et le stockage moléculaire pratique, sûr et exploitable. Une autre partie du budget sera dédiée à des appels à projet et des appels à manifestation d’intérêt vers les laboratoires intéressés ainsi qu’à l’animation scientifique.
Le CNRS est entouré de partenaires tels que l’INA (Institut national de l’audiovisuel), le Parlement européen ou encore la BnF (Bibliothèque nationale de France) et la bibliothèque universelle de codes sources de logiciels, Software Heritage, avec lesquels il souhaite mettre en place des expériences réelles d’archivage de données à grande échelle.
Pour en savoir plus :
Interview de Marc Antonini, coordinateur de ce PEPR
- 2Un zettaoctet correspond à un trilliard d’octets.