Usine Digitale

TeraLab, une plateforme d’innovation collaborative dans le Big Data

Par -

TeraLab, une plateforme d’innovation collaborative dans le Big Data © D.R.

Lancée dans le cadre des Investissements d’avenir, la plateforme TeraLab va associer chercheurs et entreprises dans des projets collaboratifs de R&D sur le Big Data. Accessible en ligne en mode cloud, elle devrait être opérationnelle à la fin de l’année 2014.

TeraLab. C’est le nom de la plateforme de R&D collaborative sur le Big Data lancée conjointement par l’Institut Mines-Télécom et le Groupe des Ecoles nationales d’économie et de statistiques (Genes). Financée par les Investissements d’avenir pour 6 millions d’euros, elle s’inscrit dans l’objectif de l’Etat de favoriser l’émergence d’une filière de Big Data en France.

Une Teramachine construite par Bull

La plateforme réunit des moyens de traitement et stockage loués selon les besoins auprès de fournisseurs de cloud computing, des corpus de données collectées sur les plateformes ouvertes ou fournies par les entreprises et des logiciels d’analyse dernier cri. Une pièce clé de l’infrastructure repose sur la Téramachine, une sorte de supercalculateur doté d’une mémoire énorme de plusieurs téraoctets. "Son rôle est d’accélérer l’accès des processeurs de calcul à de gros volumes de données, afin de tirer le maximum de valeur de la data en multipliant les croisements", explique Philippe Letellier, directeur de l’innovation à l’Institut Mines-Télécom. La construction de cette machine pourrait être confiée à Bull.

Une attention particulière est accordée à la confidentialité des données, tout particulièrement celles amenées par les entreprises. Elles seront entreposées dans des silos isolés et protégés pour éviter toutes fuites. Le choix des fournisseurs cloud devra répondre à l’obligation de garantir une localisation des données en France, ce qui laisse la porte ouverte à des prestataires tels que Cloudwatt, Numergy ou OVH. La sécurité sera également assurée par l’emploi de technologies développées par le Genes pour notamment la sécurisation des données de statistiques nationales, comme celles de l’Insee.

Une outil de formation

La plateforme sera accessible en ligne en mode cloud par les chercheurs et les entreprises dans le cadre de projets de R&D collaboratifs. Elle servira à expérimenter des applications innovantes, perfectionner des algorithmes d’analyse de données ou encore tester de nouveaux logiciels applicatifs. "L’un des enjeux est de créer des logiciels d’analyse capables de croiser beaucoup plus de données que ne peuvent faire les solutions actuelles ", explique Philippe Letellier. La plateforme servira également à la formation des Data Scientists, ces spécialistes du Big Data tant réclamés par le marché. Notamment dans le cadre des filières créées par Télécom ParisTech et l’Ensae.

TeraLab devrait ouvrir dans quelques mois dans une version basique (sans la Téramachine) et à la fin de l’année 2014 dans sa version définitive. Elle est prévue pour trois ans. Mais Philippe Letellier espère la pérenniser en trouvant un mode de financement privé en relais du financement public. Il compte également l’ouvrir à des partenaires européens dans le cadre de projets Eureka, ceci dans le but d’enrichir la catalogue d’algorithmes d’analyse à disposition des chercheurs et des entreprises.

Ridha Loukil

Partagez l’info :

Publicité

Réagissez à cet article

Error pseudo!

Error Email!

Error Captcha!

Les cookies assurent le bon fonctionnnement de nos sites et services. En utilisant ces derniers, vous acceptez l’utilisation des cookies.

OK

En savoir plus