L'autorité italienne de protection des données ouvre une enquête sur Sora d'OpenAI

La start-up OpenAI accuse le coup une nouvelle fois. Le régulateur italien chargé de la protection des données vient d'ouvrir une enquête sur son dernier outil en date, Sora, capable de créer des vidéos réalistes à partir d'instructions textuelles. Fin janvier, c'est ChatGPT qui était dans le viseur de l'autorité. OpenAI dispose désormais de 20 jours pour répondre.

Partager
L'autorité italienne de protection des données ouvre une enquête sur Sora d'OpenAI
Dévoilé mi-février, Sora est un modèle d'IA générative développé par OpenAI et capable de créer des scènes d'une minute avec une résolution de 1080p. Il peut même extraire des scènes d'autres vidéos ou les compléter.

Mi-février, OpenAI a dévoilé Sora, un modèle texte-vidéo, aux performances impressionnantes. L'outil, capable de créer des séquences vidéo réalistes à partir d'instructions textuelles et d'une durée maximale d'une minute a largement fait son effet auprès du grand public et des entreprises. Toutefois, les régulateurs ne semblent pas être du même avis. Le garant italien de la protection des données personnelles (Garante per la protezione dei dati personali) a récemment ouvert une enquête sur ce nouveau modèle.

OpenAI est invité à fournir des éclaircissements concernant son outil Sora. L'autorité italienne cherche en effet à en savoir plus sur le traitement des données personnelles des utilisateurs. L'entreprise devra donc préciser dans un délai de 20 jours si ce modèle d'IA est déjà disponible au public et s'il est ou sera proposé aux utilisateurs dans l'Union européenne et notamment en Italie.

Comment et sur quelles données est réellement entraîné l'algorithme de Sora ?

OpenAI devra également préciser à l'autorité un certain nombre de points : comment l'algorithme est entraîné ; quelles données sont collectées et traitées pour entraîner l'algorithme, en particulier s'il s'agit de données personnelles ; si des catégories particulières de données (croyances religieuses ou philosophiques, opinions politiques, données génétiques, santé, vie sexuelle) sont collectées ; et quelles sont les sources utilisées.

Le régulateur veut également connaître les modalités prévues pour informer les utilisateurs et les non-utilisateurs sur les procédures de traitement des données et les bases juridiques de ce traitement conformes au règlement européen.

Des inquiétudes justifiées après l'interview de la CTO d'OpenAI

Dans une interview accordée à The Wall Street Journal cette semaine, la CTO d'OpenAI, Mira Murati, est revenue sur le fonctionnement basique de Sora mais a éludé toutes les questions rapportant à la façon dont le modèle a été entraîné. Interrogée par la journaliste sur le type de données utilisées pour entraîner Sora, Mira Murati répond que la firme utilise "des données publiques et des données sous licence". Et c'est ici que les choses se corsent.

A la question de savoir si des vidéos issues de YouTube sont exploitées, la CTO répond par une grimace avant de préciser "ne pas être sûre de cela". Et il semble que les vidéos pourraient également provenir de réseaux sociaux comme Facebook ou Instagram... ou encore Shutterstock. Quelques secondes plus tard, la CTO d'OpenAI se reprend et revient sur sa première déclaration, à savoir qu'il s'agit "des données publiques et des données sous licence".

Si l'interview est intéressante par ailleurs, elle prouve néanmoins qu'OpenAI manque clairement de transparence et des doutes persistent quant à sa conformité avec les lois européennes relatives à la protection des données.

ChatGPT également dans le viseur du garant de la protection des données

Le 29 janvier dernier, OpenAI a déjà accusé un autre coup de la part de l'autorité italienne de régulation de la vie privée. Celle-ci a notifié à la start-up un acte de contestation suite à une violation de la réglementation en matière de protection des données personnelles.

Une conclusion qui fait suite à l'ordonnance provisoire d'interdiction du traitement adoptée par le régulateur à l'encontre de la société le 30 mars dernier. ChatGPT était de nouveau disponible en Italie un mois plus tard, le 28 avril 2023, comme en atteste le message de Sam Altman, CEO de l'entreprise. OpenAI avait alors garanti aux utilisateurs la possibilité de refuser que leurs données personnelles ne soient utilisées pour entraîner ses modèles.

SUR LE MÊME SUJET

Sujets associés

NEWSLETTER L'Usine Digitale

Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.

Votre demande d’inscription a bien été prise en compte.

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes...

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes du : Groupe Moniteur Nanterre B 403 080 823, IPD Nanterre 490 727 633, Groupe Industrie Service Info (GISI) Nanterre 442 233 417. Cette société ou toutes sociétés du Groupe Infopro Digital pourront l'utiliser afin de vous proposer pour leur compte ou celui de leurs clients, des produits et/ou services utiles à vos activités professionnelles. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.

CHERCHE TALENTS NUMERIQUE

Les formations USINE DIGITALE

Toutes les formations

ARTICLES LES PLUS LUS