Actualité web & High tech sur Usine Digitale

Big data : plus qu'une technologie, une culture

|
Twitter Facebook Linkedin Google + Email
×

Bien plus qu’une technologie pour exploiter de gros volumes de données et prévoir le comportement de systèmes, le big data est une nouvelle culture qui bouleverse les organisations.

Big data : plus qu'une technologie, une culture
Big data : plus qu'une technologie, une culture

La simulation numérique sera-t-elle abandonnée au profit du big data ? Non. Si la gestion de données toujours plus massives oblige à repenser notre façon d’appréhender le réel, modéliser un système à partir de ses composants, et faire tourner ce modèle en changeant les paramètres d’entrée, a de l’avenir. En particulier pour accélérer les travaux de R&D. Mais le big data bouscule tout. Apparu chez Google pour exploiter l’avalanche de données liées aux requêtes, il incarne une nouvelle technologie pour les uns, une nouvelle culture pour les autres, mais reste surtout perçu sous son angle technologique. Dépourvu de définition rigoureuse, il a été néanmoins décrit par le cabinet Gartner selon la règle des "3 v", pour "vitesse, volume et variété". Trois paramètres qui sont à l’origine de nouveaux outils, pour le stockage et le calcul distribué.

Ce changement technologique n’est que la partie émergée de la révolution big data. "Nous savons désormais mesurer tous les aspects du réel. Mais notre rapport aux données change, car les produire ne coûte plus rien", prévient Henri Verdier, l’administrateur général des données de l’État français, dans un entretien pour l’ouvrage collectif "Big, fast & open data", publié par l’Epita et Fyp Éditions. C’est cette quasi-gratuité de la mise en données du monde, via des capteurs en tout genre, qui va bouleverser la manière dont les scientifiques pourront comprendre, voire simuler, les systèmes complexes, autant dans les sciences dures que dans les sciences humaines. En premier lieu, parce que les scientifiques, habitués à la rareté des informations pertinentes et aux échantillonnages, peuvent désormais travailler sur des données complètes. Avec le big data, il est possible de discerner la réalité à l’échelle. Ce qui permet même d’être moins exigeant sur l’exactitude de ces informations, souvent en désordre, de qualité variable et issues d’innombrables sources. Travailler sur des données complètes, même imparfaites, permettrait surtout de prendre du recul vis-à-vis du principe de causalité, souvent source d’erreur et de mauvaise interprétation, explique Viktor Mayer-Schönberger dans le livre "Big data".

Le principe du big data est de découvrir des corrélations révélant des tendances, mais sans en expliquer l’origine. Une corrélation ne fait que quantifier la relation statistique entre deux valeurs. Elle sera forte, si la seconde valeur a de grandes chances de changer quand la première est modifiée. Les corrélations n’apportent aucune certitude, que des probabilités. Elles ne disent pas pourquoi quelque chose se produit, mais simplement qu’elle se produit. Le big data s’attaque au "quoi" et non au "pourquoi". Avec une grande précision. Conséquence, plus besoin d’émettre des hypothèses et de les vérifier. Il suffit de laisser parler les données et d’observer les connexions, dont on n’aurait parfois même pas soupçonné l’existence.

La naissance d'une révolution

Dans l’univers du big data, Viktor Mayer-Schönberger, professeur à l’Institut internet de l’université d’Oxford, est une référence. Publié en 2013, son livre "Big data", coécrit avec Kenneth Cukier, journaliste à "The Economist", l’est tout autant. Pas un rapport ou un ouvrage qui n’y fasse référence ou reprenne les exemples d’utilisation de ette manière d’exploiter les données, pas si nouvelle.

Déjà, au XIXe siècle, le cartographe américain Matthew Fontaine Maury avait systématisé la collecte de données de navigation pour tracer des cartes marines tenant compte de l’expérience de navigateurs correspondant par bouteilles à la mer ! La numérisation du monde systématise aujourd’hui cette approche, qui permet de ne plus travailler sur des échantillons mais des données complètes, même imparfaites et surtout issues de sources diverses.

Mais pour se prémunir des jugements a priori, comme dans le film "Minority Report" de Steven Spielberg, les deux auteurs proposent de soumettre les algorithmes au contrôle "d’algorithmistes" assermentés. Une piste à suivre.

 

Une approche qui trouve sa force dans la prévention de défaillances mécaniques et structurelles, dans la prédiction des réactions biologiques à des composés chimiques, à la détection des pannes de voitures ou de fraudeurs… "Cette analyse prédictive permet d’obtenir des modèles auxquels nous n’avions pas pensé", avance Charles Parat, le directeur innovation de l’entreprise de services du numérique Micropole. Pour certains, cela n’aurait rien de vraiment nouveau. "Le big data n’est qu’une évolution de la business intelligence. On le fait depuis très longtemps. Toute la simulation de HP est déjà du big data", explique Didier Kirszenberg, le responsable France des architectures massive data chez HP France. Sauf que le passage à l’échelle "n = tout" et au temps réel chamboule tout. "Nous avons découvert que les modèles apprenaient plus vite avec un très grand nombre de données imparfaites, incomplètes, qu’avec un petit nombre de données efficaces", rappelle Henri Verdier. Le "machine learning", ou apprentissage statistique, cristallise d’ailleurs la plupart des développements du big data.

Pour tenir ses promesses, celui-ci doit opérer une autre révolution, dans l’organisation cette fois. "Il nécessite une approche interdisciplinaire, avec des mathématiciens, des statisticiens, des roboticiens, des experts métiers…", explique Stéphan Clémençon, enseignant-chercheur à Télécom ParisTech et titulaire de la chaire Machine learning for big data.

Se poser les bonnes questions

Mais la gouvernance des données pose problème. "D’autant plus que les data scientists ne se contentent plus des données internes, mais vont chercher des données extérieures, qui ont un pouvoir prédictif sur le système", observe Marc Batty, le directeur commercial de Dataiku. Lancer des projets de big data oblige donc non seulement à casser les silos en interne et à mixer les compétences, mais aussi à se poser de nouvelles questions. "La plus grande difficulté pour les entreprises réside dans leur capacité à oser s’interroger, observe Laurent Letourmy, le cofondateur de l’agence de conseil Ysance, dans un entretien avec l’Epita. Le fait d’oser imaginer une question n’est ni particulièrement simple ni très naturel." Ainsi, un groupe comme PSA, qui pensait utiliser les métadonnées issues des capteurs des voitures pour la maintenance prédictive a été amené à s’interroger sur l’usage des voitures !

Quant au rapport au risque, il s’en trouve totalement modifié. Ces énormes bases de données ne sont plus là pour valider des hypothèses, mais pour en trouver de nouvelles. Ce que l’on en retire peut donc se révéler contre-intuitif, voire remettre totalement en cause les pratiques menées jusque-là. Les entreprises doivent pouvoir accepter d’abandonner un projet ou de le réorienter brutalement, à l’image de ce que font les champions du numérique les plus agiles. "Les big data se comportent un peu comme le capital-risque. Peut-être que sur cinq projets un seul sera valable", prévient Charles Parat. Enfin, le big data pourrait bouleverser les hiérarchies. "La prise de décision se démocratise sur le lieu de travail et beaucoup d’experts autoproclamés voient leur expertise remise en cause à la lumière du big data, dont les perspectives et les prédictions s’avèrent bien plus exactes", avertit Viktor Mayer-Schönberger. Mieux vaut en être conscient.

Aurélie Barbaux

Réagir

* Les commentaires postés sur L’Usine Digitale font l’objet d’une modération par l’équipe éditoriale.

Publicité

media

Les cookies assurent le bon fonctionnement de nos sites et services. En utilisant ces derniers, vous acceptez l'utilisation des cookies.OK

En savoir plus
Suivez-nous Suivre l'Usine Digitale sur twitter Suivre l'Usine Digitale sur facebook Suivre l'Usine Digitale sur Linked In RSS Usine Digitale