Recevez chaque jour toute l'actualité du numérique

x

Les plateformes pour l'IA tournées vers la collaboration en entreprise se multiplient

Les datalabs mis en place par les industriels doivent s’ouvrir pour associer les experts métiers au développement des modèles d’intelligence artificielle. Des plateformes de nouvelle génération le permettent.
Twitter Facebook Linkedin Flipboard Email
×

Les plateformes pour l'IA tournées vers la collaboration en entreprise se multiplient
GE Aviation s’appuie sur la plate-forme Dataiku pour développer son programme Self-Service data. Cet outil a permis à ses équipes de mener plus de 2000 projets.

S'ouvrir pour étendre et pérenniser les usages de l’intelligence artificielle. Le constat s’est imposé : il faut abattre les murs des datalabs et permettre à tous les experts métiers de collaborer, voire de développer eux-mêmes leurs modèles d’IA. Après Watson d’IBM, une nouvelle génération de plateformes de data science se développe pour faciliter un usage plus intégré et industrialisé de la data par les entreprises.

Une approche de bout-en-bout
La première caractéristique de ses plateformes, c’est leur vaste couverture fonctionnelle, comme l’explique Alexis Fournier, le vice-président de la stratégie IA pour l’Europe, le Moyen-Orient et l’Afrique chez Dataiku : "Nous proposons une plateforme end-to-end, c’est-à-dire capable de couvrir l’ensemble des tâches du cycle de vie du modèle. L’idée est d’avoir une interface unique pour définir les sources de données, les analyser, concevoir et tester le modèle jusqu'à le déployer dans l’infrastructure".

Reprise par de nombreux éditeurs, cette approche se traduit par des capacités d’intégration et de manipulation des données très développées. Le système doit pouvoir se connecter à l’ensemble des sources de données potentiellement exploitables par un algorithme, que celles-ci soient structurées (base de données), semi-structurées (fichiers XML) ou non structurées (textes, images, sons). Il fournit ensuite des outils de préparation de données qui vont permettre à un data engineer et à un expert métier de les rendre exploitables par un algorithme d’IA. Enfin, il offre des outils interactifs de manipulation de données, de tests du modèle sur un échantillon de données jusqu'à son déploiement dans le cloud public ou sur un serveur de l’entreprise.

Tous les outils sur une même plateforme
Concentrer tous les outils sur une même plateforme implique que des profils très différents puissent travailler dessus. Les informaticiens de la DSI (direction des systèmes d’information) vont paramétrer les sources de données, les data scientists vont coder leurs algorithmes directement dans leur langage préféré, qu’il s’agisse de SQL, de Python ou des langages spécialisés R et SAS, et exploiter les bibliothèques d’algorithmes développées dans ces langages.

Enfin, les experts métiers doivent, eux aussi, exploiter la plateforme pour analyser leurs données. Il est difficile, voire impossible, de former ces profils non informaticiens à des langages complexes et de les contraindre à développer. La solution des éditeurs est de proposer un mode dual : les data scientists peuvent coder leurs algorithmes manuellement dans le langage de leur choix, tandis que les experts métiers disposent d’un mode de type « no-code ». L’interface graphique leur permet d’élaborer un modèle en manipulant des algorithmes prêts à l’emploi, sous forme de composants.

"Nous nous adressons à tous les utilisateurs potentiels de la donnée dans l’entreprise, souligne Raphaël Savy, le directeur pour l’Europe du Sud de l’éditeur américain Alteryx. Les utilisateurs métiers doivent pouvoir résoudre les problématiques qu’ils connaissent le mieux grâce à leur expertise, c’est ce que l’on appelle les citizen data analysts". Le logiciel Alteryx Designer propose plus de 250 composants prêts à l’emploi, que les experts pourront manipuler pour analyser leurs données sans programmation.

automatisation du traitement de la donnée
Cette approche « no-code » est désormais reprise sur toutes les plates-formes de data science modernes et des algorithmes d’IA sont également déployés afin d’aider ces citizen data analysts à manipuler les données ou même à choisir le meilleur algorithme en fonction de la nature de ces données. C’est le cas de la plateforme Viya de l’éditeur SAS, qui suggère les algorithmes en assortissant chacun d’eux d’un taux de confiance, mais aussi d’un argumentaire en langage naturel.

Faire travailler tous les collaborateurs impliqués dans l’exploitation des données sur une même plateforme est un moyen de faire émerger des idées et de les tester très rapidement sur un mode « test and learn ». Mais il ne s’agit pas de se limiter aux POC (preuves de concept), bien au contraire. Ces plateformes visent à accélérer la mise en production de modèles. La priorité doit être donnée à la réutilisation des traitements, notamment ceux qui portent sur l’intégration des données. "Le nettoyage et la normalisation des données sont des tâches très chronophages, précise Raphaël Savy. Il faut réduire les délais induits par ces manipulations grâce à la réutilisation et à l’automatisation des traitements à appliquer aux données".

Vers une industrialisation de la production des modèles
D'autre part, des workflows transversaux permettent aux projets de modèles d’avancer pas à pas jusqu'à la mise en production, qui prend souvent du temps. De nombreuses semaines sont parfois nécessaires pour les développeurs et les ingénieurs d’exploitation afin d’industrialiser le modèle et d’assurer la sécurité des données. Les éditeurs apportent des solutions pour accélérer cette étape, notamment en hébergeant sur la plateforme des web services prêts à être interrogés par les applications de l’entreprise, ou en générant de manière automatique des conteneurs logiciels prêts à être installés sur un serveur d’entreprise ou dans le cloud.

Pensées pour faciliter le travail collaboratif sur la data, ces plateformes se veulent également simples à installer et à faire évoluer, en tout cas bien plus que les ERP (progiciels de gestion intégrés). "L’intérêt des plateformes de data science modernes est que leur déploiement peut être progressif, souligne Pascal Brosset, le directeur technique de l’activité digital manufacturing de Capgemini. L’investissement initial est faible, notamment pour celles disponibles dans le cloud, et on va déployer les cas d’usage de l’IA un par un, en fonction des priorités et de la stratégie de l’entreprise".

La possibilité de souscrire à une plateforme SaaS (software as a service), avec un paiement à l’usage, limite les dépenses et va permettre d’obtenir rapidement des premiers succès, un moyen de rallier peu à peu les différentes directions de l’entreprise et d’étendre les usages de l’IA partout où ils sont pertinents. Viendront ensuite la phase de structuration de toutes ces initiatives et la création d’un modèle de données commun, d’une sémantique commune à toute l’entreprise, qui faciliteront encore la création de nouvelles IA. 

Réagir

* Les commentaires postés sur L’Usine Digitale font l’objet d’une modération par l’équipe éditoriale.