Actualité web & High tech sur Usine Digitale

Recevez chaque jour toute l'actualité du numérique

x

Entreprises, candidats : osez les concours pour data scientists

Les plates-formes lançant des challenges aux data scientists avec des prix à la clé, comme Kaggle.com ou Datascience.net, sont de plus en plus utilisées par les entreprises et les candidats. Voici pourquoi.
Twitter Facebook Linkedin Flipboard Email
×

Entreprises, candidats : osez les concours pour data scientists
Entreprises, candidats : osez les concours pour data scientists © Antonia Machayekhi

Résoudre des énigmes, répondre à des questions de façon inventive et susciter des questions qui n'avaient pas encore été posées grâce à l'exploitation des données : c'est le quotidien du data scientist, ce nouvel acteur chargé de transformer les promesses du big data en valeur et en opportunités pour l'entreprise. Par bien des aspects, le travail de ce matheux, nourri à l'informatique et à l'algorithmique, peut s'apparenter à un jeu de pistes, à une plongée dans l'océan des mégadonnées.

D'ailleurs, des plates-formes s'appuient sur cet aspect ludique pour pousser les data scientists, débutants ou confirmés, dans leurs retranchements, par l'intermédiaire de challenges. Kaggle.com est le leader de ce secteur, avec une aura mondiale. En France, en début d'année, la plate-forme Datascience.net est née. Elle fédère aujourd'hui 1 500 participants à qui de plus en plus d'entreprises (publiques comme privées) lancent des défis. Qu'espèrent les entreprises et les candidats de cette démarche ?

Côté entreprises : un accélérateur d'innovations

Au même titre qu'un hackathon, lancer un challenge sur une plate-forme de data scientists comme Kaggle ou datascience.net permet de stimuler l'innovation au sein d'une entreprise ou d'une organisation. "Cela peut permettre aux équipes de se fixer de nouveaux objectifs, explique Arnaud Laroche, de la plate-forme datascience.net. L'enjeu, pour elles, une fois le concours terminé : obtenir les mêmes résultats que ceux atteints par les candidats mais avec des méthodes plus simples à mettre en œuvre, plus industrialisables".

Faire appel à la communauté de data scientists permet aussi de faire émerger de nouvelles méthodes de travail. "Pour les entreprises, c'est une façon de traiter des problèmes auxquelles elles sont confrontées et qu'elles ne peuvent pas résoudre par des méthodes classiques" ajoute le spécialiste. A condition évidemment d'avoir isolé les données à traiter (ce qui demande une sensibilisation préalable) et d'avoir fixé des objectifs clairs.

C'est également un moyen de repérer de jeunes talents en vue d'un futur recrutement, et de démontrer sa capacité d'innovation aux yeux du public, dans une optique de communication. La SNCF, Axa, Ecometering (une filiale de GDF Suez) ou encore l'Insee se sont laissés tenter.

Côté candidats : une façon d'apprendre et de se faire remarquer

A condition de maîtriser les bases de l'analyse de données et des modèles mathématiques (qu'on peut acquérir via des MOOcs ou des formations dédiées), la participation à des concours présente bien des avantages. C'est d'abord un moyen d'apprendre en dehors de son champ de compétences. "On se casse les dents sur tous types de problèmes, dans tous les domaines : c'est extrêmement formateur", résume Christophe Bourguignat, candidat émérite devenu data scientist senior chez Axa. "On y apprend aussi à travailler en équipe, et on vit presque en direct les ruptures technologiques en voyant défiler différentes générations d'algorithmes. On acquiert des choses pas académiques, pas documentées", ajoute-t-il.

Les concours sont donc une bonne façon d'apprendre le métier. Et, in fine, de se faire remarquer par un recruteur. "Avoir le classement le plus élevé possible, à l'échelon national ou mondial, cela permet d'asseoir sa crédibilité", explique Christophe Bourguignat. Les dotations sont une source de motivation supplémentaire, même si il ne faut pas compter ses heures pour espérer terminer sur le podium d'un challenge.

Mais attention : les concours, où l'on manipule des jeux de données "nettoyés", ne sont pas représentatifs de ce que les data scientists trouveront dans les entreprises, une fois embauchés. "Des données propres, facilement disponibles, ce n'est pas comme dans le vraie vie", prévient Christophe Bourguignat. C'est une dimension du job qui n'est pas reflétée par les concours, mais qui représente une bonne partie du travail "IRL" (In real life) : les data scientists doivent en être conscients au moment de se lancer dans le grand bain.

Sylvain Arnulf

 
media
Suivez-nous Suivre l'Usine Digitale sur twitter Suivre l'Usine Digitale sur facebook Suivre l'Usine Digitale sur Linked In RSS Usine Digitale