IA générative : Nouvelle plainte contre Meta pour violation du droit d'auteur

Le dirigeant de Meta, Mark Zuckerberg est accusé d’avoir donné son accord pour l’entrainement de ses modèles de langage Llama avec des œuvres protégées par le copyright et provenant d’une vaste base de données piratée. Le réseau social se défend en affirmant que l’exploitation des ouvrages en question relève du "fair use" (usage raisonnable) du droit américain.

Partager
IA générative : Nouvelle plainte contre Meta pour violation du droit d'auteur

Des documents compromettants ont été remis le 8 janvier dernier à un tribunal californien dans le cadre d’une nouvelle affaire de violation des droits d’auteur opposant la multinationale technologique, Meta à trois auteurs américains (les romanciers Richard Kadrey et Christoper Golden ainsi que la comédienne Sarah Silverman) qui lui reprochent d’avoir utilisé leurs œuvres pour entraîner des modèles d’IA sans autorisation ni aucune offre de compensation.

Une bibliothèque numérique controversée

Les documents affirment que Meta a téléchargé le contenu d'œuvres protégées compilées dans Library Genesis – alias "LibGen", une énorme base de données de contenus piratés qui a fait elle-même l’objet de plaintes en 2023 de la part de groupes d'édition américains spécialisés dans l'éducation, la recherche et les contenus pédagogiques

En effet, en septembre dernier, la justice américaine a décidé de bloquer la plateforme (qui comporte 33 millions de livres et 84 millions d'articles en accès libre) et d’infliger une amende de 30 millions d’euros à ses créateurs. Or selon la nouvelle plainte contre Meta, Mark Zuckerberg, fondateur et dirigeant de l'entreprise, aurait lui-même approuvé l’utilisation de LibGen pour entrainer les modèles d'IA de l’entreprise, connus sous le nom de Llama.

"Les avocats des auteurs accusent Meta d'avoir traité la soi-disant disponibilité publique des ensembles de données clandestins comme un laissez-passer, en dépit du fait que les dossiers internes de Meta montrent que tous ses décideurs, y compris son CEO, Mark Zuckerberg, étaient conscients que LibGen était un ensemble de données piratées", a affirmé une source proche de la défense au magazine américain Wired.

Les craintes des employés de Meta

Des discussions en interne qui ont fuité montrent par ailleurs que certains employés de Meta savaient que l’utilisation de la base de données clandestine, pouvait porter préjudice à l’entreprise. "Si les médias suggèrent que nous avons utilisé un ensemble de données que nous savons piratées, tel que LibGen, cela pourrait nuire à notre position de négociation avec les autorités de réglementation sur ces questions", aurait ainsi expliqué un des développeurs.

Dans un mémo présenté devant le tribunal, les avocats de Meta ont affirmé que leur client n’a pas enfreint la loi sur les droits d’auteurs et qu’il n’y a pas de preuves sur l’utilisation de LibGen comme base de données pour l’entrainement de ses modèles d'IA. Ils ont aussi mis en avant une disposition de la réglementation américaine, en l’occurrence "l’usage raisonnable" (Fair Use en anglais), un principe légal selon lequel l'utilisation d'éléments protégés par des droits d'auteur est autorisée, dans certaines circonstances, sans l'autorisation du titulaire des droits. Une défense fréquemment mise en avant par les entreprises développant des modèles d'IA, comme OpenAI.

Il est à noter que la premiere plainte des auteurs contre Meta pour violation du droit d’auteur date de 2023. Une autre plainte a ciblé OpenAI et l’entraînement de ChatGPT.

Sujets associés

NEWSLETTER L'Usine Digitale

Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.

Votre demande d’inscription a bien été prise en compte.

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes...

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes du : Groupe Moniteur Nanterre B 403 080 823, IPD Nanterre 490 727 633, Groupe Industrie Service Info (GISI) Nanterre 442 233 417. Cette société ou toutes sociétés du Groupe Infopro Digital pourront l'utiliser afin de vous proposer pour leur compte ou celui de leurs clients, des produits et/ou services utiles à vos activités professionnelles. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.

CHERCHE TALENTS NUMERIQUE

Les formations USINE DIGITALE

Toutes les formations

ARTICLES LES PLUS LUS