Recevez chaque jour toute l'actualité du numérique

x

Avec Azure Purview, Microsoft veut automatiser la gouvernance des données d'entreprise à l'échelle du pétaoctet

A mesure que la réglementation amènent les entreprises à responsabiliser la gestion de leurs données se pose la problématique de pouvoir cartographier précisément quelles sont ces données et où elles se trouvent. Pour faciliter ce processus, Microsoft lance Azure Purview, une solution de gouvernance à très grande échelle capable de centraliser la gestion de très grandes quantités de données, peu importe la forme qu'elles prennent, tout en les classifiant automatiquement.
Twitter Facebook Linkedin Flipboard Email
×

Avec Azure Purview, Microsoft veut automatiser la gouvernance des données d'entreprise à l'échelle du pétaoctet
Avec Azure Purview, Microsoft veut automatiser la gouvernance des données d'entreprise à l'échelle du pétaoctet © Microsoft

Microsoft annonce ce 3 décembre une nouvelle fonctionnalité Azure dédiée à la gouvernance de très grandes quantités de données d'entreprise. Baptisée Purview, elle est construite sur Azure Synapse, un service conçu pour pouvoir traiter des bases de données hétérogènes stockées dans des formats et lieux différents et n'utilisant pas forcément les mêmes technologies.

Centraliser la gestion de grandes quantités de données disparates
L'idée de base de Microsoft avec Synapse est de casser non seulement les silos de données, mais aussi les silos technologiques et de compétences. Il présente évidemment le cloud comme le remède à ce mal né de plus d'une décennie passée à créer des data lakes et data warehouses aux caractéristiques et technologies différentes et souvent incompatibles entre elles.

Azure Synapse, lancé il y a un an, a vu le nombre de clients Azure traitant des quantités de données de l'ordre du pétaoctet (1 million de gigaoctets) multiplié par cinq, et est déjà utilisé par des entreprises comme Walgreens, Myntra ou P&G. Uniquement réservée aux clients privilégiés jusqu'à présent, elle est désormais ouverte à tous.

L'une des entreprises à déployer la solution à grande échelle en ce moment est FedEx. Le transporteur s'en sert pour créer sa nouvelle plateforme de suivi logistique en temps réel FedEx Surround, qui est capable de suivre 16 millions de colis chaque jour, avec plus de 10 scans par colis et l'intégration de données météo et de trafic routier.

Identifier, classer, cataloguer et sécuriser les données où qu'elles se trouvent
Purview est la suite logique de Synapse car il va permettre de savoir exactement où se trouvent toutes les données de l'entreprises (data center internes, clouds publics et privés, applications SaaS, PowerBI...) et comment elles sont gérées, avec un historique détaillé des mouvements et actions effectuées sur chaque base, sans oublier les droits d'accès. Chaque donnée est classée et cataloguée.

Le service est évidemment conçu avec la réglementation à l'esprit et permet grâce à des techniques d'intelligence artificielle d'identifier automatiquement les données à caractère personnel, mais aussi les données métier sensibles ou les données non conformes. Uniquement disponible pour les solutions Microsoft à l'heure actuelle, cette fonctionnalité sera étendue aux autres fournisseurs cloud en février 2021.

Microsoft estime qu'en automatisant au maximum ces problématiques de gestion grâce à la puissance du cloud, les data scientists peuvent mieux se concentrer sur des tâches à valeur ajoutée. Purview est d'ailleurs né d'un projet interne pour répertorier les propres données de Microsoft, avant d'être proposé sous forme de service à ses clients.

Réagir

* Les commentaires postés sur L’Usine Digitale font l’objet d’une modération par l’équipe éditoriale.

 
media