Recevez chaque jour toute l'actualité du numérique

x

Sarus lève deux millions d'euros pour son outil d'analyse de données respectueux de la vie privée

Levée de fonds Faire de l'IA sans compromettre la vie privée des personnes. Voici l'objectif de Sarus, qui lève deux millions d'euros auprès de Serena et XAnge pour poursuivre le développement de son logiciel, encore au stade de prototype. L'idée est de permettre aux data scientists de travailler sur des données personnelles sans y avoir directement accès. L'outil repose sur la méthode de la "confidentialité différentielle", déjà largement utilisée par Google et Apple.
Twitter Facebook Linkedin Flipboard Email
×

Sarus lève deux millions d'euros pour son outil d'analyse de données respectueux de la vie privée
Sarus lève deux millions d'euros pour son outil d'analyse de données respectueux de la vie privée © Markus Spiske-Unsplash

La start-up parisienne Sarus a annoncé le 21 avril 2020 une levée de deux millions d'euros pour déployer sa solution de protection des données personnelles à destination des data scientists. Le tour de table a été mené par les fonds d'investissements Serena et XAnge. Pour Sarus, cette opération est l'occasion de recruter de nouvelles personnes pour renforcer son équipe actuelle de six membres.

Un logiciel au stade de prototype
"Sarus a développé une technologie qui répond au problème suivant : comment faire de l'IA sur des données sensibles sans avoir besoin d'y accéder ?", résume Maxime Agostini, président et cofondateur de Sarus, interrogé par L'Usine Digitale. En effet, pour utiliser des algorithmes, les data scientists ont besoin d'une très grande quantité de données. Or pour respecter la vie privée, ces données doivent être dépourvues d'informations identifiantes comme le nom, le prénom, l'âge, le sexe, l'adresse postale, le numéro de téléphone… Lancé en janvier 2020, Sarus a développé un logiciel – encore au stade de prototype – qui permet justement aux data scientists de travailler sur des données personnelles sans y accéder directement.

Aujourd'hui, les entreprises spécialisées dans l'IA anonymisent les données grâce à un ensemble de méthodes. "A chaque fois, elles se posent la question suivante : est-ce que j'ai supprimé suffisamment d'éléments identifiants pour avoir une confiance raisonnable dans le fait qu'on ne pourra pas remonter à l'individu ?", indique Maxime Agostini. Car ces techniques ont deux inconvénients. D'une part, elles ne sont pas assez fiables c'est-à-dire qu'il est possible de remonter plus ou moins facilement à la source de la donnée. D'autre part, à force de "purger" cette donnée l'information qui en résulte n'a plus aucun intérêt. "Nous ne proposons pas d'améliorer ces méthodes car elles sont leurs faiblesses sont inhérentes", annonce le cofondateur de Sarus. La jeune pousse a donc développé un outil qui repose sur une nouvelle méthode d'anonymisation : la confidentialité différentielle (differential privacy), une technique est déjà utilisée par des grandes entreprises technologiques comme Apple ou Google.

Minimiser les risques d'identification
La confidentialité différentielle permet de fournir un résultat  en minimisant les risques d'identification des entités qu'elle contient. Prenons l'exemple d'une ville qui souhaite savoir où elle devrait placer un arrêt un bus. Pour obtenir le meilleur résultat possible, elle va avoir besoin de travailler sur les données personnelle de géolocalisation (lieu d'habitation, de travail…). L'outil développé par Sarus va alors créer une série de cartes en enlevant aléatoirement les individus un par un. Si pour chaque carte, l'arrêt de bus est placé au même droit cela signifie que le résultat ne dépend ni de l'ajout ni du retrait d'un individu. Conséquence de quoi, il est impossible de rattacher une donnée de géolocalisation à une personne.

Même si la technique est complexe, le défi de Sarus est surtout d'intégrer sa solution dans les outils existants des data scientists. "La confidentialité différentielle n'est pas un élément différenciant à très long terme car plein d'acteur travaillent déjà dessus. Le but est vraiment l'intégration", déclare Maxime Agostini.

Imagerie médicale, finance, smart cities…
Le logiciel développé par Sarus n'est pas encore commercialisé. "Nous réfléchissons actuellement au modèle : peut-être sous forme d'abonnement mensuel… ?", s'interroge Maxime Agostini. Mais la jeune pousse est déjà en discussion avec des acteurs dans le domaine de l'imagerie médicale, de la finance et des smart cities pour lancer des projets pilotes qui permettraient de finaliser la solution. "Les données de la ville obéissent toutes aux mêmes contraintes : ce sont des données personnelles. Les villes ne veulent pas être impliquées dans un scandale de privacy d'où l'intérêt de recourir à notre solution", explique-t-il.

Réagir

* Les commentaires postés sur L’Usine Digitale font l’objet d’une modération par l’équipe éditoriale.

 
media