Actualité web & High tech sur Usine Digitale

French tech : les surdoués de la donnée

|
Twitter Facebook Linkedin Google + Email
×

Les start-up françaises savent comment faire parler les mégadonnées. Présentation des dix spécialistes les plus à la pointe, qui aident les entreprises dans leur projet de big data.

French tech : les surdoués de la donnée
French tech : les surdoués de la donnée

Entre son école de mathématiques exemplaire et la qualité de la formation de ses ingénieurs, la France a tout naturellement une carte à jouer dans les big data. Si les outils de collecte, de stockage et de traitement restent l’apanage de grands groupes américains comme IBM, Oracle, SAS, Informatica et Teradata, ou de la communauté open source, avec une plate-forme comme Hadoop, la valeur ajoutée des français réside dans la simplification de ces outils et, surtout, dans l’analyse des mégadonnées pour aider les responsables métiers à les exploiter. Aujourd’hui, cette tâche reste artisanale et seulement à la portée de quelques spécialistes, les fameux "data scientists". C’est sur ce terrain encore vierge que les start-up françaises jouent leurs meilleurs atouts. Certaines, comme PredicSis, Spikenet Technology ou Quinten, se démarquent par leurs algorithmes de datamining, spécialisés par secteurs d’activité ou par type de problématique. D’autres, comme Captain Dash, Dataiku, Nexedi ou OpenDataSoft, développent des solutions accessibles en ligne via un simple navigateur web, pour simplifier l’accès aux outils de stockage, de calcul et d’exploitation. D’autres encore se spécialisent dans les services, comme Data & Data et Perfect Memory. Mais pour toutes, une même marque de fabrique : l’originalité.

Captain Dash croise données internes et externes

Service

Date de création : Décembre 2009
Lieu : Paris
Effectif : 40 personnes
CA : 10 millions d’euros en 2017
Levée de fonds : 1,5 million d’euros 

La société offre un service d’agrégation, de corrélation et d’exploration des données. Elle croise les données métiers de l’entreprise avec des données externes (open data, réseaux sociaux, web…) pour déterminer, par exemple, l’impact de la météo sur le comportement d’achat des consommateurs. Les résultats sont présentés sur mobiles sous forme d’indicateurs de bord, utiles au pilotage des activités de ventes et marketing. Le tout quasiment en temps réel. Cette solution, fruit de trois ans de développement, traite des volumes de plusieurs milliards de lignes. Déployée dans 24 pays, elle est proposée en service cloud accessible sur abonnement, de 80 000 à 500 000 euros par an. Un quart des entreprises du CAC 40 l’utilise. Captain Dash compte s’implanter en Amérique du Nord cette année.

Clients : BPCE, Axa, Danone, L’Oréal, SNCF

Spikenet Technology interprète les images vidéo

Technologie

Date de création : Août 1999
Lieu : Balma (Haute-Garonne)
Effectif : 14 personnes
CA : 1,4 million d’euros en 2014
Levée de fonds : Néant

Créé par des chercheurs du Cerco, laboratoire de recherche en neurosciences du CNRS à Toulouse, Spikenet développe un moteur de vision artificielle qui s’inspire de la biologie. Cet algorithme fonctionne comme un œil électronique capable de fouiller et d’analyser de grands volumes d’images vidéo. La première application a été la mesure de la visibilité des marques sur la télévision. Elle est également exploitée par les services de police et de sécurité pour le décryptage rapide des images de caméras de vidéosurveillance, par les services de transports pour le suivi du trafic routier et par les casinos pour l’optimisation de leur fonctionnement. La société, qui compte 30 clients, vend le logiciel en licence ou sous forme de redevance sur les produits qui l’utilisent. Elle s’attend à un chiffre d’affaires de 3 millions d’euros en 2015 et de 10 millions dans cinq ans.

Clients : Ministère de l’Intérieur, Aria Resort & Casino, Airbus,Aéroport de Bordeaux-Mérignac, Cofely Ineo…

Data & Data traque la contrefaçon sur le net

Service

Date de création : Septembre 2012
Lieu : Paris
Effectif : 10 personnes
CA : 3 millions d’euros en 2015
Levée de fonds : Néant

Data & Data propose une plate-forme de surveillance et de détection des ventes de contrefaçons sur le web et les réseaux sociaux. Il combine deux moteurs technologiques maison : l’un pour l’exploration en 12 langues du web et des réseaux sociaux et la détection des comptes suspects ; l’autre pour le tri, par apprentissage statistique, entre les vrais et faux comptes. Un compte de contrefaçon est détecté moins de cinq minutes après sa création. La marque peut ainsi riposter presque en temps réel en demandant au réseau social sa fermeture ou en alertant les services de la douane. Disponible pour les marques de luxe et de cosmétiques, le service va s’étendre à la pharmacie et aux pièces détachées auto. Le développement des algorithmes représente un investissement de plus de 1 million d’euros. Pour accompagner sa croissance, la société prévoit cette année d’embaucher 20 personnes et de procéder à une levée de fonds de 500 000 à 1 million d’euros.

Clients : Dix des plus grandes marques françaises et italiennesde cosmétiques et de luxe

Quinten affine l’analyse de données cliniques

Service

Date de création : Novembre 2008
Lieu : Paris
Effectif : 25 personnes
CA : 2 millions d’euros en 2014
Levée de fonds : Néant

Quinten propose des services d’analyse fine des données avec un algorithme unique sur le marché. Baptisé Q-Finder, ce système s’inspire des modèles financiers pour identifier, non pas des tendances, mais un profil particulier et son contraire. Sa première application a été de trouver, dans les données des essais cliniques, la catégorie de patients pour laquelle un médicament donné sera efficace ou sans effets secondaires importants. Depuis un an et demi, les applications se diversifient : prévisions des facteurs de hausse ou de baisse de valeurs dans la finance, détection des clients en voie de passer à la concurrence dans l’assurance, construction des parcours clients dans les aéroports… L’algorithme s’est enrichi de fonctions de réseaux de neurones et d’apprentissage statistique. La société envisage de le vendre en tant que logiciel, en 2016.

Clients : Covéa, Danone, L’Oréal, Aéroports de Paris, Sanofi, Roche

Perfect Memory gère vos données

Service

Date de création : Juillet 2008
Lieu : Chamalières (Puy-de-Dôme)
Effectif : 10 personnes
CA : N.C.
Levée de fonds : 600 000 euros

L’entreprise se définit comme le conservatoire de la mémoire numérique des entreprises. Sa plate-forme web comporte 50 modules pour la collecte, le traitement, l’enrichissement, l’indexation ou encore la valorisation des données. Le client peut ainsi accéder à des données internes, structurées et fiables, complétées par d’autres récoltées sur internet, pour améliorer son marketing ou la compréhension de ses clients. Le service combine un moteur d’intelligence artificielle et de web sémantique, ainsi qu’un dispositif de préservation et de valorisation de contenus audiovisuels. Son développement représente un investissement de 2 millions d’euros.

Clients : Radio France, ministère de la Culture belge, Viacom

Hurence met le big data à la portée des métiers

Technologie

Date de création : Avril 2011
Lieu : Grenoble
Effectif : 10 personnes
CA : N.C.
Levée de fonds : Néant

 

Créé par des anciens d’IBM, HP, Xerox et Capgemini, Hurence veut mettre l’analyse de données à la portée des responsables marketing, vente et autres métiers. Sa plate-forme logicielle s’installe facilement au-dessus d’une distribution Hadoop, sans le conseil ou l’accompagnement d’un spécialiste, en s’appuyant sur la technologie d’imageurs Docker. Interface, tableau de bord… La start-up revendique une avance de deux ans sur SAP ou Oracle. Cette solution est gratuite pour une seule machine de traitement et payante pour des grappes de plusieurs machines.

Clients : EDF, Orange, Veolia

Dataiku, le plombier du Big data

Service

Date de création : Février 2013
Lieu : Paris
Effectif : 23 personnes
CA : 1 million d’euros en 2014
Levée de fonds : 3 millions d’euros

Avec sa plate-forme Data science studio, la start-up parisienne démocratise le big data en automatisant les tâches techniques qui réclament les compétences d’un data scientist : préparation, nettoyage et croisement des informations, connexion aux bases de données open source, test de modèles d’analyse, vérification des prédictions… Déchargés de toute cette "plomberie", les analystes peuvent développer plus rapidement des applications métiers prédictives. L’interface s’inspire des jeux vidéo pour faciliter une appropriation progressive de l’outil. Le logiciel est gratuit pour moins de 100 000 lignes de données. Au-delà de ce volume, il est vendu sur abonnement à partir de 20 000 euros par an. Il a déjà séduit une vingtaine de clients. Fait assez rare, l’entreprise a été rentable dès son premier exercice, en 2014.

Clients : Cdiscount, PagesJaunes, Vente-privée, BlaBlaCar, Chronopost…

Nexedi, l’alternative française à Hadoop

Technologie

Date de création : Décembre 2001
Lieu : Marcq-en-Barœul (Nord)
Effectif : 30 personnes
CA : 2 millions d’euros en 2014
Levée de fonds : Néant

Cet éditeur de logiciel open source a lancé Wendelin, une plate-forme open source qu’il présente comme une alternative française au géant Hadoop, autre technologie open source d’origine américaine. Sa solution combine Neo, sa base de données NoSQL, et le moteur d’apprentissage statistique Scikit-Learn de l’Inria. Sa particularité ? Elle s'affranchit des limites de mémoire dans les machines pour traiter d’énormes volumes de données. La version, disponible aujourd’hui gratuitement en téléchargement, convient pour quelque 10 Go de données. Un projet dans les investissements d’avenir vise à en étendre la capacité à 10 To dans trois ans. Cible ? Le traitement des données issues des objets connectés industriels.

Clients : Sanef, Infoterra, Mitsubishi Motors…

OpenDataSoft mutualise les données

Service

Date de création : Décembre 2011
Lieu : Paris
Effectif : 10 personnes
CA : 600 000 euros en 2014
Levée de fonds : Néant

La société édite une plateforme cloud de publication, de partage et de réutilisation de données. Elle les transforme et les rend exploitables dans des applications métiers et facilement accessibles en temps réel, y compris sur mobiles. L’utilisateur peut ainsi croiser ses propres données avec d’autres sources (facteurs socio-économiques, clients, météo…) pour créer des usages innovants de big data. Plusieurs clients peuvent mutualiser leurs données afin d’élargir la base d’analyse et d’améliorer la qualité des résultats. La plate-forme s’enrichit toutes les semaines de nouvelles fonctionnalités.

Clients : Axa, Veolia, SNCF, RATP, Keolis, La Poste

PredicSis détecte les clients fragiles

Service

Date de création : Juillet 2013
Lieu : Lannion (Côtes-d’Armor)
Effectif : 18 personnes
CA : 300 000 euros en 2014
Levée de fonds : 1 million d’euros

Avec sa solution de prédiction des comportements des clients et des internautes, PredicSis aide les entreprises à réduire leur taux d’attrition, à savoir le nombre de clients perdus. Fondé sur un moteur d’apprentissage statistique, ce logiciel s’appuie sur dix ans de R & D chez Orange labs. Son objectif est d’améliorer la rétention des clients en analysant les données de leurs interactions avec l’opérateur. Il scrute près de 750 000 variables de comportements afin d’identifier les personnes fragiles. Après avoir injecté toutes ses interactions clients (e-mails, logs web…), l’entreprise peut alors obtenir la liste des consommateurs prêts à la quitter et les causes de leur départ. Le service est accessible en ligne sur abonnement à partir de 100 euros par mois.

Clients : Renault, Orange, Sodexo, EDF, 1 000 Mercis…

Ridha Loukil

Réagir

* Les commentaires postés sur L’Usine Digitale font l’objet d’une modération par l’équipe éditoriale.

media

Les cookies assurent le bon fonctionnement de nos sites et services. En utilisant ces derniers, vous acceptez l'utilisation des cookies.OK

En savoir plus
Suivez-nous Suivre l'Usine Digitale sur twitter Suivre l'Usine Digitale sur facebook Suivre l'Usine Digitale sur Linked In RSS Usine Digitale